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Editoriale 


Gianfranco Barbieri 

Direttore di 
"Elettronica e Telecomunicazioni" 


La televisione nasce ufficialmente in Italia il 3 gen¬ 
naio 1954 con le prime trasmissioni dagli Studi RAI 
di Torino. In quegli anni gli abbonati alla TV sono 
poco più di ventimila; il televisore è un oggetto 
ingombrante a causa dell'imponente tubo catodico 
e dell'elettronica a valvole: costa come un'utilitaria, 
pesa più di una ventina di kg e diffonde immagini 
in bianco e nero da un unico canale. Fino alla fine 
degli anni '50, il televisore è protagonista nei bar, 
nei cinema e nei luoghi di aggregazione. La visione 
è prevalentemente collettiva. 

Le telecamere sono enormi e pesanti: con ottiche, 
view-fìnder ed accessori si arriva a superare i 60 kg 
(rendendo necessario l'uso di un robusto cavalletto). 
I programmi nascono all'interno degli studi televi¬ 
sivi. La trasmissione in diretta degli avvenimenti di 
attualità, in particolare di quelli sportivi, avviene in 
misura sporadica e richiede un grande dispendio 
di mezzi tecnici. 

I programmi sono costituiti in prevalenza da sce¬ 
neggiati, telegiornali e spettacoli di intrattenimento 
ma sono soprattutto strumenti di informazione ed 
educazione; solo un quinto della popolazione parla 
correntemente l'italiano (quasi il 13% è analfabeta). 
La pubblicità entra in televisione nel 1957, ma ad 
essa viene riservato uno spazio di soli 10 minuti 
al giorno. La tv dei primi anni è una finestra su 
un mondo a molti sconosciuto. Essa rappresenta 


l'uscita dall'isolamento; aree di popolazione in cui 
si parlava esclusivamente il dialetto imparano l'ita- 
liano;"Lascia o raddoppia"diviene il programma più 
seguito mentre la platea televisiva si allarga a milioni 
di persone. Un fenomeno di massa di portata storica. 

A distanza di 60 anni il panorama ci appare radi¬ 
calmente mutato, al passo coi profondi mutamenti 
che la società della comunicazione sta imponendo, 
a tutti i livelli, sia nei paesi sviluppati che, seppur in 
misura minore, in quelli in via di sviluppo. La tele¬ 
visione, in quanto mezzo di comunicazione a forte 
supporto tecnologico, si sta posizionando con de¬ 
terminazione all'interno dei processi di convergen¬ 
za; pratiche sociali che sembravano appannaggio 
tipico ed esclusivo del comparto informatico stanno 
via via estendendosi alla fruizione su schermo televi¬ 
sivo. Il processo evolutivo è piuttosto frammentato 
a causa delle esigenze di mercato ma soprattutto 
della rapida trasformazione tecnologica che spesso 
impone sacrifici alle esigenze di compatibilità con i 
retaggi del passato. 

Se osserviamo la grande varietà di sistemi attraver¬ 
so i quali il contenuto audiovisivo può oggi essere 
raccolto, consultato, archiviato e riutilizzato ci ren¬ 
diamo conto che la digitalizzazione della televisione 
ha costituito l'anello mancante della catena che in 
poco più di un decennio ha trasformato in digitale 
i grandi flussi informativi del nostro pianeta. 
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La convergenza delle tecnologie sta, in altre paro¬ 
le, riportando la televisione ad occupare un ruolo 
centrale nella geografia dei canali che possono 
essere utilizzati per veicolare verso l'utente, ieri solo 
spettatore, oggi cliente, i contenuti audio video di 
suo interesse. 


Gli articoli pubblicati nel presente numero della 
nostra rivista ci offrono una panoramica dei diversi 
fronti sui quali il Centro Ricerche della RAI è oggi 
impegnato per stare al passo con i processi di ibrida¬ 
zione che vedono coinvolte le pratiche di fruizione 
dei prodotti e delle tecnologie multimediali. 
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Stretch TV e Easy TV: 


la TV adattata ai propri tempi 


Andrea Del Principe, Carmen Marino, Mauro Rossini 
Rai - Centro Ricerche e Innovazione Tecnologica 


1. Evoluzione del mezzo e della "cultura 
televisiva" 

Il cinema e la televisione hanno subito, nel corso de¬ 
gli anni, una evoluzione straordinaria nei mezzi tec¬ 
nici ed espressivi, nella tecnologia di distribuzione 
e nei contenuti. Nell'anno 1954 nasce la televisione 
nel nostro Paese. Dagli studi Rai diTorino iniziano le 
prime trasmissioni regolari della televisione Italiana. 



Domenica 3 gennaio 1954 - "La Rai, Radio 
Televisione Italiana, inizia oggi il suo regolare 
servizio di trasmissioni televisive"- è la voce 
dell'annunciatrice Fulvia Colombo che con queste 
parole dà il via alla prima trasmissione televisiva 
Italiana. 


Il cinema e la televisione hanno subito una 
evoluzione straordinaria nei mezzi tecnici come nei 
contenuti. L'esigenza di stare al passo con i tempi e 
con una società che vive a ritmi sempre più serrati 
ha cambiato profondamente il modo di realizzare i 
programmi televisivi e radiofonici. 

Il modo di condurre i programmi è radicalmente 
cambiato dagli anni cinquanta ad oggi, da una 
televisione in bianco e nero che "entrava"nelle case 
con discrezione e trasmetteva solo in alcune ore del 
giorno ad un palinsesto come quello attuale con 
canali che trasmettono 24 ore al giorno e caratteriz¬ 
zato da ritmi e tempi veloci. 

Anche l'utente è cambiato, oggi il telespettatore 
seleziona rapidamente con il telecomando una serie 
di canali per decidere cosa guardare e con i televiso¬ 
ri connessi alla rete seleziona i contenuti e realizza 
un proprio palinsesto. 

Le persone con disabilità e gli anziani, per contro, 
chiedono fortemente la riduzione della complessità 
del mezzo televisivo e la riduzione delle barriere tec¬ 
nologiche. I progetti Stretch TV e Easy TV, avviati da 
RAI - Centro Ricerche e Innovazione Tecnologica e 
da RAI - Segretariato Sociale, si pongono l'obiettivo 
di sviluppare una soluzione tecnologica che per¬ 
metta di migliorare significativamente la fruibilità 
dei contenuti televisivi da parte delle persone con 
disabilità sensoriali e/o cognitive e degli anziani. 


www.crit.rai.it 


Elettronica eTelecomunicazioni N° 1/2015 


5 











era basso: le statistiche del 1950 indicavano che il 
13% degli italiani era analfabeta e solo il 20% della 
popolazione utilizzava correntemente l'italiano. 
Nelle famiglie non si parlava l'italiano ma il dialetto, 
così come negli altri contesti della vita quotidiana. 
In questo scenario la Televisione ha contribuito in 
modo determinante a formare una unità culturale 
e soprattutto linguistica. 

1.1 II linguaggio televisivo 

Il "Programma Nazionale", successivamente divenu¬ 
to RAI UNO, fu il primo canale ricevibile in Italia, al 
quale si affiancò il "Secondo Programma" nel 1961. 



Trasmissioni Televisive 
anni'50 e'60. 


Il programma "Non è mai troppo tardi" condotto 
dal Maestro Manzi dal 1960 al 1968 - Un milione 
e mezzo di italiani presero la licenza elementare 
grazie a questo programma televisivo. 

A differenza degli Stati Uniti d'America dove la TV 
assume da subito un ruolo determinante nel circuito 
commerciale ed è priva di canone, in Europa la 
televisione diventa invece strumento con finalità 
culturali ed è gestita dalle istituzioni pubbliche. 

L'Italia del'54 era molto diversa da quella di oggi ed il 
"servizio pubblico"televisivo viene pensato con una 
forte connotazione educativa oltre che informativa 
e di intrattenimento. Il paese, politicamente unito 
da circa un secolo, divenuto repubblica pochi anni 
prima, presentava realtà regionali molto radicate e 
differenti tra loro. 

Il grado di scolarizzazione nell'Italia del dopoguerra 


La prima immagine trasmessa dalla RAI fu quella 
dell'annunciatrice Fulvia Colombo che annunciò 
l'avvio delle trasmissioni televisive. Il Telegiornale 
(l'attualeTG1 ) e La Domenica Sportiva andarono in 
onda dal primo giorno e la loro programmazione 
dura tuttora. I conduttori televisivi vennero scelti 
tra le personalità di spicco del mondo della radio, 
del giornalismo e del teatro: Mike Bongiorno, Cor¬ 
rado Mantoni, Enzo Tortora, Mario Riva, Delia Scala, 
Walter Chiari, Raimondo Vianello, Sandra Mondaini 
ed il frate cappuccino Padre Mariano, conduttore 
della rubrica religiosa "La posta di Padre Mariano". 

Gli argomenti da trattare e il linguaggio consentito 
erano controllati da una normativa rigorosa. Ad 
esempio l'uso di parole le cui radici e desinenze 
potessero alludere ad organi sessuali come ad esem¬ 
pio cazzotto o semplifica o "in seno al partito... " era 
proibito, come anche deridere, seppur velatamente, 
qualunque personaggio ecclesiastico o politico 
italiano o straniero. 
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Si deve considerare che nei primi anni della tele¬ 
visione la tecnologia di registrazione video non 
esisteva. 

Alcuni programmi venivano realizzati usando la 
pellicola cinematografica, altri come i quiz e i varietà 
venivano trasmessi in diretta. 

Con le trasmissioni in diretta la censura poteva can¬ 
cellare senza appello un intero programma se que¬ 
sto violava le regole imposte. Un caso emblematico 
fu il varietà "La piazzetta" (1956) in cui la ballerina 
Alba Arnova andò in scena con una calzamaglia 
color carne che con la trasmissione in bianco e 
nero diede l'impressione che le gambe non fossero 
coperte. Dopo diverse interrogazioni parlamentari 
e l'intervento del Vaticano, venne allontanata dalla 
televisione. Un altro caso fu la sospensione del va¬ 
rietà "Un, due, tre"e l'allontanamento dei conduttori 
Vianello eTognazzi per aver parodiato una caduta 
del presidente della Repubblica Gronchi, il quale 
non gradì la battuta. 

Il palinsesto televisivo della prima serata dal'54 al'61 
era rigido a programmazione giornaliera, con ciclici¬ 
tà settimanale. Dopo ilTelegiornale, il lunedì veniva 
trasmesso un film a lungometraggio, il martedì uno 
sceneggiato o un lavoro di prosa, il mercoledì film 
o telefilm, il giovedì un programma di quiz (nacque 
il famoso "Lascia o Raddoppia"), il venerdì teatro 
(commedia o dramma), il sabato uno spettacolo di 
varietà, la domenica uno sceneggiato. Il palinsesto 
era caratterizzato da una grande qualità. I migliori 
professionisti lavoravano alla sua realizzazione. 


Gruppo di persone raccolte per 
seguire le lezioni di Telescuola. 




Il primo videoregistratore Ampex con nastro da 2 
Pollici (1956). La videoregistrazione, inizialmente 
molto costosa, divenne realtà diffusa solo negli anni 
seguenti. 

Oltre all'informazione e all'intrattenimento vennero 
introdotti programmi educativi come "Non è mai 
troppo tardi"con il maestro Alberto Manzi. Questo 
programma permise a moltissimi analfabeti di con¬ 
seguire la licenza elementare. 

Nel 1959 a seguito di un accordo tra la RAI ed il Mini¬ 
stero della Pubblica Istruzione fu istituita "Telescuo¬ 
la", una struttura per la produzione di trasmissioni 
didattiche. Queste trasmissioni venivano spesso 
seguite collettivamente da studenti raggruppati nei 
"punti di ascolto" messi a disposizione dai comuni 
o dagli oratori. 



La famosa apparizione di Totò al 
programma "Lascia o Raddoppia". 


www.crit.rai.it 


Elettronica eTelecomunicazioni N° 1/2015 











1.2 La pubblicità e Carosello 

Nel 1957 nasce "Carosello"e viene introdotta la pub¬ 
blicità in televisione. Si tratta di un vero e proprio 
spettacolo in cui si susseguono quattro spot (in alcu¬ 
ni anni anche cinque o sei) della durata complessiva 
di nove - dieci minuti al giorno, in base agli anni. 

Se da un lato si sentiva la spinta del boom economi¬ 
co, la televisione di stato e i suoi dirigenti sentivano il 
dovere morale di non promuovere i simboli del con¬ 
sumismo in un paese impegnato nella ricostruzione 
dopo la guerra e fu deciso di confinare la pubblicità 
in un programma separato dalle altre trasmissioni 
che avevano, invece, una missione educativa. Il pro¬ 
gramma "Carosello" era strutturato in modo rigido 
e fortemente regolamentato: ogni scenetta veniva 
approvata da una commissione speciale della SACIS 
che, vagliato ogni spot, ne autorizzava o meno la 
messa in onda. 


Le scenette dovevano essere in pellicola da 35 
millimetri, bianco e nero. La lunghezza dello spot 
doveva essere di 135 secondi di cui, però, solo 35 
potevano essere usati per reclamizzare il prodotto. 
Era consentito pubblicizzare solo un prodotto per 
volta e il nome della marca poteva essere pronun¬ 
ciato per un massimo di sei volte. Durante la parte 
dello sketch (i primi 100 secondi) non dovevano 
esserci riferimenti al prodotto che poteva comparire 
sullo sfondo ma non essere parte dell'azione. Questo 
formato editoriale differenziava Carosello da tutta 
la pubblicità mondiale. Negli anni i migliori registi 
e attori italiani hanno contribuito al successo e alla 
qualità di Carosello. I creativi realizzarono spot di 
grande fascino e personaggi intramontabili, come 
Calimero, così riuscito da essere più famoso del de¬ 
tersivo che reclamizzava. Carosello era una rubrica 
amatissima soprattutto dai bambini e, di fatto, per 
vent'anni è stato l'unico spazio che la rete ha con¬ 
cesso alla pubblicità. 



Lo storico programma "Carosello"in onda dalle 20.50 alle 21.00 
dal '57 al 77. Per vent'anni l'unico spazio concesso dalla RAI 
alla pubblicità. 
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1.3 Evoluzione del linguaggio televisivo 

La televisione italiana inizia una trasformazione 
radicale con la fine del monopolio RAI nel 1976. La 
moltiplicazione dei canali e dell'offerta televisiva, 
pensata con un'ottica più commerciale, cambia 
profondamente il linguaggio della televisione. 

Dal 1954 al 1975 i programmi del palinsesto erano 
concepiti come singoli blocchi, introdotti da una 
annunciatrice e completati da una sigla di aper¬ 
tura e chiusura. Ogni programma era facilmente 
identificabile, con appuntamenti ripetuti a cadenza 
giornaliera o settimanale. Le persone conoscevano 
a memoria gli orari dei programmi di loro interesse. 

I programmi e i tempi televisivi si trasformano a 
partire dagli ultimi anni'70, perdendo il carattere di 
delimitazione tra un programma ed un altro. Nella 
televisione degli anni '80 e '90 le sigle si contrag¬ 
gono, gli annunci sono sempre più rari e nascono 
programmi che in un'unica cornice accorpano più 
generi televisivi, il capostipite di questi programmi 
"contenitore" è "Domenica in." in onda dal 1976. 

La nuova televisione è caratterizzata da un palin¬ 
sesto organizzato con appuntamenti quotidiani e 
la pubblicità non è più relegata ad orari predefiniti 
ma si configura come inserti di breve durata, inizial¬ 
mente messi in onda tra un programma e l'altro per 
arrivare alla situazione attuale in cui i programmi 
vengono interrotti frequentemente dagli spot 
pubblicitari. 

1.4 Evoluzione dei mezzi tecnici e dei linguaggi 

Diversamente dagli anni'50 quando negli studi le 
telecamere erano in numero ridotto e semifìsse, le 
produzioni attuali possono contare su più teleca¬ 
mere, alcune fìsse, alcune su carrello o su braccio 
mobile a cui aggiungere le steadycam e le Flycam 
che consentono una ripresa dall'alto. Questo porta a 
fare sequenze più brevi,"staccando"frequentemen- 
te tra le telecamere con il risultato di dare maggior 
dinamicità e ritmo ai programmi, dando luogo 
ad una narrazione più spedita. La disponibilità 
di materiale registrato da inserire nei programmi 


insieme alle parti in diretta e la possibilità di effet¬ 
tuare collegamenti con altri studi o con strutture di 
ripresa esterne, porta ad una maggiore dinamicità 
dei programmi rispetto al passato. Tutto questo si 
traduce in un aumento del ritmo e della velocità 
con cui inquadrature e dialoghi si avvicendano 
sullo schermo. 


2. Evoluzione della televisione dal punto 

DI VISTA LINGUISTICO 

I cambiamenti dei quali è stata protagonista la RAI 
dal 1975 in poi con la riforma RAI e la lottizzazione 
portano ad una profonda trasformazione della TV, 
fino ad allora "scuola di lingua". 

Si assiste ad una transizione da una televisione con 
uno scopo educativo ad una televisione più rivolta 
all'intrattenimento, affidandosi a conduttori e gior¬ 
nalisti che parlano un italiano distante da quello 
standard. I programmi RAI iniziano a introdurre 
personaggi che presentano sfumature di linguaggio 
dialettale e si avvicinano ai modi di dire e di parlare 
delle masse. 

2.1 II linguaggio televisivo tra codici e modi di 
dire: una complessa semplicità. 

Mentre agli albori della televisione il modo di parlare 
dei conduttori era molto simile a quello radiofonico, 
con l'evolversi del mezzo e soprattutto della"cultura 
televisiva" la lingua italiana usata in televisione ha 
assunto caratteristiche peculiari sfruttando la siner¬ 
gia tra parole ed immagini. Il linguaggio televisivo 
utilizza, infatti, una serie di codici che presuppongo¬ 
no che lo spettatore abbia familiarità con il mezzo 
e sia in grado di integrare quanto viene detto con 
le immagini. La frase "come vedete, qui un fronte di 
aria fredda può dare luogo a temporali in quest'area 
delle Alpi..." non ha significato se non la si associa 
al conduttore impegnato ad indicare una cartina. 

II parlato televisivo presenta caratteristiche della lin¬ 
gua parlata e di quella scritta, nonostante tra le due 
vi sia molta differenza. Vengono usati codici verbali 
misti e alla formazione del messaggio concorrono 
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i codici verbali e non verbali, il codice prossemico, 
i simboli, il linguaggio grafico, la musica e il codice 
iconico. Modi di dire e frasi coniate da giornalisti e 
conduttori entrano a far parte della cultura di massa 
e vengono poi utilizzati come linguaggio standard. 
Una lingua che è stata "trasmessa" e recepita da 
milioni di persone, tanto da diventare parte del 
linguaggio comune. 

I programmi televisivi sono condizionati dal tempo 
a disposizione che, spesso, per via delle logiche 
commerciali, dura da una pubblicità all'altra. 

2.2 II "parlato controllato" 

Le trasmissioni televisive vengono progettate da 
autori, registi, artisti, sceneggiatori ed altri, tramite 
una complessa fase di preparazione che avviene 
in forma scritta. I testi televisivi, da quelli dei tele- 
giornali a quelli dei varietà, sono scritti per essere 
letti. La lingua che ne scaturisce risulta vicina alla 
forma scritta ed è sintetica e priva di ridondanze o 
ripetizioni. Ha quindi le caratteristiche di un "parlato 
controllato". 

Mentre da una parte c'è la necessità di mantenere 
un registro colloquiale, adatto ad un pubblico ete¬ 
rogeneo al quale comunicare una grande quantità 
di informazioni, dall'altra vi è l'esigenza di spiegare 
le cose con chiarezza e sintesi, restando nei tempi 
previsti dal programma che sono decisi a priori 
dalla Rete. 

A ciò si deve aggiungere che le trasmissioni televi¬ 
sive e i loro conduttori mirano a "ridurre le distanze" 
con il telespettatore fino al punto che l'enorme 
artificio fatto di studi di ripresa, telecamere, ponti 
e ricevitori TV diventi trasparente e avvenga un 
coinvolgimento reale ed empatico dello spettatore 
e della sua sfera emozionale. Questa sensazione di 
familiarità, collegata alle esigenze di conduzione 
prima esposte, porta in molti casi ad accelerare il 
parlato fino ad un ritmo che a volte rende l'ascolto 
e la comprensione difficoltosi. 

Per avere un riferimento, un parlato da 150-160 pa¬ 
role al minuto consente un ascolto confortevole, ge¬ 


neralmente la velocità media di una conversazione è 
di 200 parole al minuto, il record italiano è stato per 
lungo tempo detenuto da Paolo Bonolis, conduttore 
e autore televisivo che allo scopo di stabilire il record 
ha pronunciato 335 parole in un minuto, poi ridotte 
a 332 perché tre risultavano errate. 

Per le ragioni dette in precedenza, la comprensione 
del messaggio televisivo richiede l'attenzione alle 
immagini e ai simboli presenti sullo schermo. Ad 
esempio in un servizio giornalistico solitamente 
ascoltiamo un commento, guardiamo immagini 
che a volte provengono dal repertorio e sono at¬ 
tinenti ma non collegate direttamente al parlato e 
così, nella nostra mente, si produce l'effetto della 
comunicazione. 

Pervia dell'evoluzione tecnologica dei mezzi di pro¬ 
duzione, della nascita di un linguaggio proprio del 
mezzo televisivo, differente da quello del cinema, 
del teatro e della radio, nonché della monetizza- 
zione degli spazi televisivi che diventano un bene 
di mercato disponibile per le aziende che possono 
fare pubblicità ai propri prodotti, i tempi televisivi 
diventano molto più veloci. 

2.3 I TEMPI TELEVISIVI E LE NECESSITÀ DI ANZIANI E 
DISABI LI 

Il grado di "civiltà" di una società si valuta anche 
dall'attenzione rivolta alle persone con disabilità e 
agli anziani. 

Un approccio integrato ai servizi di accesso che 
si occupano di rendere la televisione più fruibile 
dai disabili, se opportunamente studiato, risulta 
estremamente utile anche per una fascia molto 
più ampia di popolazione: è fondamentale, infatti, 
tenere conto che la progressiva riduzione delle 
capacità sensoriali e cognitive è un processo a cui 
si va incontro in modo fisiologico con l'età; si parla, 
infatti, di disabilità acquisite. 

La popolazione europea sta invecchiando e si sti¬ 
ma che, nel 2050, il 30% delle persone avrà più di 
65 anni (Proiezione Eurostat 2004/2050). La causa 
di questo invecchiamento della popolazione può 
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essere ricondotta all'aumento della speranza di vita 
e alla riduzione della natalità. 

L'evoluzione dei ritmi di esposizione e l'aumento 
della complessità dei dialoghi rendono difficoltosa 
la comprensione dei contenuti televisivi da parte di 
una vasta categoria di persone come, ad esempio, 
gli anziani e le persone con disabilità. 

3. Stretch TV e Easy TV 

I progetti Stretch TV e Easy TV si propongono di 
aumentare la fruibilità dei contenuti televisivi 
adattando le caratteristiche dell'audio e del video 
alle necessità specifiche dell'utente con disabilità 
sensoriali o cognitive. 

3.1 Stretch TV 

Con le più avanzate tecnologie di processing au¬ 
dio/video è possibile ridurre la velocità del video 
e dell'audio di un programma, senza perdita di 
intelligibilità, offrendo all'utente una funzione che, 
tramite telecomando, permetta di rallentare la vi¬ 
sione del contenuto per adattarla ai propri tempi di 
visione. Rivedere un programma televisivo o vederlo 


in modo più lento può permettere a molte persone 
di fruirne in modo ottimale, comprendendo meglio 
il contenuto ed eliminando il senso di frustrazione 
che scaturisce dal fatto di non cogliere totalmente 
ciò che viene detto. Prendendo spunto dagli studi 
di Zhao e Griffith sull'argomento sono state de¬ 
terminate delle soglie di wpm (words per minute) 
associate a livelli di comprensibilità diversi. Si è 
comunque evidenziato come lasciare all'utente la 
scelta di impostare la velocità del parlato a proprio 
piacimento consenta una migliore comprensione 
dei contenuti. 

3.2 Stretch Tv e le lingue straniere 

La tecnologia precedentemente descritta trova 
applicazioni anche nel campo didattico, favorendo 
la comprensione delle lingue straniere ed il loro 
apprendimento. Ascoltare un film in una lingua stra¬ 
niera conosciuta, in modalità rallentata, aumenta 
in modo significativo la comprensione dei dialoghi 
e della storia rappresentata. Una metodologia 
sperimentata da Y.Zhao per apprendere meglio 
una lingua straniera è rivedere/risentire un contri¬ 
buto audio/video con coefficienti di rallentamento 
progressivamente decrescenti fino a comprendere 
l'intero passaggio a velocità originale. 
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3.3 Easy TV 


3.4 Piattaforme di erogazione del servizio 


La comprensibilità di un contenuto televisivo, oltre 
che dalla velocità del parlato è influenzata dalla qua¬ 
lità tecnica dell'audio e dalle condizioni di ascolto. 
Un sistema, in fase prototipale alla data di scrittura 
del presente documento, consente di analizzare 
tramite una procedura di test le caratteristiche 
dell'apparato uditivo e visivo dell'utente. Il sistema 
analizza contemporaneamente anche le caratte¬ 
ristiche dell'audio/video riprodotti dal dispositivo 
usato per vedere il programma televisivo (televisore, 
computer, tablet ecc). 

Terminata la fase di test viene elaborata una curva 
di correzione che compensa le carenze rilevate e 
riporta audio e video in condizioni ottimali. 

Tenendo traccia delle misurazioni e compensazioni 
effettuate e integrandole con le informazioni per¬ 
sonali riguardanti l'utente (genere, età, scolarità, 
professione, patologie note) è possibile definire 
una base dati per elaborare le informazioni su 
base statistica, individuando così profili utente che 
consentano di ricavare configurazioni standard di 
visione e ascolto ottimali per differenti tipologie di 
utenti e programmi televisivi. 
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3.4.1 WEB e Mobile 

Il servizi descritti potrebbero essere proposti sul 
web, con l'obiettivo di corredare i molti contenuti 
disponibili on-demand con la funzione di rallenta¬ 
mento e miglioramento dell'audio/video. L'utilizzo 
della piattaforma web consentirebbe di fruire dei 
contenuti e del servizio di rallentamento e mi¬ 
glioramento dell'audio/video utilizzando diversi 
dispositivi quali Smartphone, Tablet e Smart TV. Gli 
strumenti offerti dalla piattaforma web consentireb¬ 
bero, inoltre, di rilevare le statistiche di utilizzo del 
servizio fornendo un utile strumento di valutazione 
delle preferenze degli utenti e permettendo la loro 
profilazione. 

3.4.2 TV-ConnectedTV 

Le stesse funzionalità potrebbero essere offerte 
direttamente sui televisori connessi a internet 
aggiungendo la funzionalità di rallentamento e 
miglioramento dell'audio in servizi interattivi, come 
ad esempio la Rai Replay. 
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Perché sentire e comprendere la televisione può essere importante 


Gli audioiogi concordano che le persone anziane 
hanno maggiori difficoltà nella comprensione del 
linguaggio parlato, specialmente in ambienti rumo¬ 
rosi. La difficoltà di comprensione aumenta quando 
più persone parlano contemporaneamente, quando il 
parlato è veloce e quando la quantità di informazioni 
espresse è eccessiva. Le ricerche audiologiche, spesso 
finalizzate alla produzione e commercializzazione di 
apparecchi acustici protesici, individuano tre fattori 
principali che concorrono alla riduzione della capacità 
di comprendere il parlato: 

• degradamento della funzionalità uditiva peri¬ 
ferica (orecchio medio e interno); 

• degradamento generale delle capacità cogni¬ 
tive; 

• cambiamenti nel processo uditivo centrale 
(interpretazione a livello cerebrale). 

Nello studio presentato in [1] sono stati esaminati gli 
effetti della capacità uditiva sui processi neurali che 
supportano l'elaborazione del linguaggio parlato. 

A tale scopo è stata usata la risonanza magnetica 
funzionale per monitorare l'attività cerebrale di adulti 
in età avanzata durante l'ascolto di contenuti audio 
con livelli di complessità linguistica crescente. La va¬ 
lutazione delle risonanze magnetiche dei partecipanti 
all'esperimento ha messo in evidenza come ad una 
maggiore capacità uditiva individuale corrispondesse 
un maggiore coinvolgimento della circonvoluzione 
bilaterale temporale superiore (inclusa la corteccia 
uditiva primaria), talamo e tronco encefalico. 

In un secondo esperimento è stata esaminata la re¬ 
lazione tra la capacità uditiva dei singoli e l'integrità 
della struttura corticale mediante VBM (Voxel Based 


Morphometry) dimostrando una relazione lineare tra 
la capacità uditiva di una persona e il volume della 
materia grigia nella corteccia uditiva primaria. Questi 
risultati suggeriscono che anche un calo moderato 
della capacità uditiva periferica può portare ad un 
decadimento sistematico dell'attività neuraiepreposta 
all'elaborazione degli aspetti di più alto livello della 
lingua parlata. E' stata individuata una relazione 
diretta tra la riduzione della capacità uditiva e la 
perdita di volume della materia grigia nella corteccia 
uditiva primaria. 


Relazione tra la 
capacità uditiva ed il 
volume della materia 
grigia corticale. 
[Jonathan Peelle, PhD/ 
Penn Medicine] 



[1 ] J.E. Peelle,V.Troiani, M. Grossman, A.Wingfield, 
Hearing Loss in Older Adults Affects Neural 
Systems Supporting Speech Comprehension, in 
"The Journal of Neuroscience", 31 August 2011, 
31(35), pp. 12638-12643 
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Olografìa: quale realtà? 


Mario Muratori 

Rai - Centro Ricerche e InnovazioneTecnologica 


1. Introduzione 

Presso il Centro Ricerche e Innovazione Tecnologica 
(CRIT) si svolge un'attività di ricerca relativa alla 
visione tridimensionale. 

Fino al 2014 si è considerata la stereoscopia tradizio¬ 
nale, in inglese nota col nome di plano-stereoscopy, 
poiché più facilmente realizzabile. Nel corso degli 
anni si è sviluppata una catena produttiva completa, 
dalla ripresa multicamera controllata da una regia, 
all'editing e alla successiva masterizzazione di BD 
dimostrativi; alcuni prodotti 3D sono stati anche 
trasmessi sul canale RAI HD, ad esempio il docu- 
mentario"Le non persone"di Roberto Olla, RaiTGl. 

Alla data dell'articolo si nota un certo rilassamento 
dell'interesse del pubblico e degli operatori per la 
stereoscopia, apparentemente a causa della neces¬ 
sità di indossare occhiali specifici. 

Tuttavia nei laboratori avanzati non cessa la ricerca 
né si arresta la proposizione sul mercato di tec¬ 
nologie e apparati per la visione tridimensionale, 
spesso spacciandoli per olografici anche se basati 
su tecniche diverse. 

In questo articolo, oltre a tentare di far chiarezza 
sull'olografia millantata si cerca di testimoniare lo 
stato dell'arte della tecnica olografica vera applicata 
alla visualizzazione tridimensionale. 


In diversi laboratori di ricerca le tecniche di ripro¬ 
duzione di immagini in movimento tridimensionali 
continuano ad essere sviluppate, anche nell'ambito 
di progetti finanziati europei; per contro si dà per 
scontata una certa diminuzione dell'interesse per 
la stereoscopia, sia in campo cinematografico che 
televisivo. 

Quest'ultimo potrebbe anche solo essere dovuta 
alla fine fisiologica del periodo in cui prevale la novi¬ 
tà; infatti, al giorno d'oggi le tecniche di produzione 
sono acquisite e la fetta di mercato e di utenza è ben 
identificata; essa, peraltro, pur rappresentando una 
nicchia, esiste ed è soddisfatta dalla tecnica stereo¬ 
scopica. 

Considerato che una grande azienda informatica 
ha recentemente presentato i suoi occhiali per la 
realtà aumentata il cui nome commerciale richiama 
esplicitamente l'olografia, sembrava opportuno 
effettuare una ricognizione, ancorché limitata, per 
aggiornarsi sulla situazione relativa alle tecniche di 
visione tridimensionale più avanzate della stereo¬ 
scopia tradizionale e, in particolare, all'olografia. 

Effettuando ricerche in rete si trovano molti riferi¬ 
menti all'ologafia, ma, approfondendo, si è scoperto 
che in pochi casi viene utilizzata la vera tecnica 
olografica. 

Per contro, negli ultimi anni in alcuni laboratori 
avanzati si sono sviluppati metodi per limitarne 
considerevolmente i limiti applicativi, anche se non 
è ancora stata raggiunta una maturità tecnologica 
tale da ottenere risultati qualitativi comparabili alle 
comuni tecniche televisive e cinematografiche. 

In questo articolo, oltre a tentare di far chiarezza 
sulla olografia millantata si cerca di testimoniare lo 
stato dell'arte della tecnica olografica "vera"appli¬ 
cata alla visualizzazione tridimensionale. 
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2. E'TUTTO OLOGRAFIA? 

L'olografia è una tecnica di ripresa e visualizzazione 
basata sulla diffrazione di luce coerente, con cui l'im¬ 
magine di un oggetto complesso tridimensionale 
può essere riprodotta utilizzando uno schermo bi¬ 
dimensionale dotato di trasparenza complessa, che 
rappresenti l'ampiezza e la fase del fronte dell'onda 
luminosa. 

E' pensiero comune che l'olografia in tempo reale 
sia il massimo per la visualizzazione di oggetti tri¬ 
dimensionali in movimento ed è quindi logico che 
si tenda alla definizione di una tecnica opportuna 
per ottenerla. 

Tuttavia, in un nostro precedente articolo [1] si 
descriveva la tecnica olografica messa a punto da 
Gabor Nota 1 (compresi i successivi miglioramenti) 
evidenziando alcune difficoltà ad applicarla alla 
televisione. 

Come mai, allora, quando si parla di 3D escono come 
funghi tecniche e apparati olografici [2]? 

Secondo noi perché con alcune tecniche si otten¬ 
gono immagini translucide e magari anche tridi¬ 
mensionali, caratteristiche tipiche delle immagini 
ottenute con l'olografia. Inoltre, la parola olografia 
ha un che di magico, similmente, ad esempio, alla 
parola elettromagnetismo, e perciò viene molto 
disinvoltamente utilizzata da un certo marketing 
non del tutto corretto per suscitare interesse verso 
il prodotto pubblicizzato. 

Con ciò non si vuole nulla togliere a molte realizza¬ 
zioni che sicuramente danno ottimi risultati e sono 
frutto di un grande lavoro di sviluppo tecnico e 
tecnologico, ma si dovrebbe accettare che, se non 
si basano sulla tecnica di Gabor o sue derivazioni, 
non si possono chiamare olografiche. 


2.1 Lenti di Fresnel 

Già da molto tempo si trovano sul mercato degli 
schermi olografici che in verità non sono altro che 
delle lenti di Fresnel utilizzate in retroproiezione per 
deflettere i raggi luminosi. In questo modo si può 
ubicare il proiettore in posizione defilata e nasco¬ 
sta. Un'accorta illuminazione dell'ambiente in cui 
si trova lo schermo permette di nascondere la sua 
presenza, col risultato di produrre delle immagini 
translucide che sembrano fluttuare nel vuoto. 

Un sistema più rozzo è quello basato su un semplice 
schermo semitrasparente per retroproiezione che 
funziona per diffusione nel flusso luminoso inci¬ 
dente. A questo tipo di visualizzatori appartengono 
anche gli schermi formati da una lama d'acqua 
nebulizzata. 

In questo caso è più difficile nascondere sia il proiet¬ 
tore, che spesso si deve porre in asse, sia lo schermo, 
che non essendo completamente trasparente risulta 
più visibile. Tuttavia, con installazioni opportune 
si possono ottenere risultati molto interessanti 
(figura 1). 


Ma non è olografia. 



Fig. 1 - Uso artistico di schermi olografico (a sinistra) 
e semitrasparente (a destra) [3] 


Nota 1 Lo scienziato ungherese Dennis Gabor (Gabor Dénes) (Budapest, 1900 -Londra 
1979) sviluppò la tecnica, da lui chiamata "olografia", nel 1947 come metodo 
per aumentare la risoluzione dei microscopi elettronici. Per questa invenzione 
Gabor ottenne il premio Nobel nel 1971. 
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2.2 Pepper's Ghost 


Il Fantasma di Pepper (meglio conosciuto come 
Pepper's Ghost) è una tecnica illusoria usata in teatro 
e in vari trucchi magici. 

Utilizza una lastra trasparente di vetro, plexiglass 
o altri film plastici unita a particolari tecniche di 
illuminazione, per dare l'illusione che gli oggetti 
appaiano e scompaiano, diventino trasparenti o si 
inseriscano all'Interno di ambienti o tra altri oggetti 
o personaggi. 

La tecnica prende il nome da John Henry Pepper, 
che riprese l'effetto inventato nel XVI Secolo dal 
filosofo e alchimista italiano Giovanni Battista Della 
Porta e lo rese famoso. 

Lo spettatore vede il palcoscenico o comunque 
l'area in cui verrà riflessa l'immagine fantasma, ma 
non una stanza nascosta, anche detta stanza blu, 
adiacente al palcoscenico e perfettamente specu¬ 
lare ad esso anche negli oggetti contenuti. 



Fig. 2 - Sistema di proiezione EyeLiner™ 
di Musion [5] 



Fig. 3- Esempio di piramide olografica 
illuminata da un tablet [6] 


La stanza ha pareti completamente nere e contiene 
esclusivamente oggetti ben illuminati. Questi ultimi 
vengono riflessi dalla lastra trasparente e quindi 
appaiono come se fossero sul palcoscenico come 
immagini fantasma traslucide. Le apparizioni ap¬ 
paiono e scompaiono ogniqualvolta le luci puntate 
sugli oggetti vengono accese o spente. Illuminando 
alternativamente gli oggetti sul palcoscenico e nella 
stanza si possono realizzare effetti di morphing [4], 

Aziende come Musion, Eon Reality, 360 Brand Vi¬ 
sion, emmegi e altre che emergono tra i primi risul¬ 
tati quando si effettua la ricerca della parola chiave 
olografia in rete, realizzano apparati e spettacoli 
molto avvincenti - a giudicare dai video messi a 
disposizione sui relativi siti - ma basati, e non sem¬ 
pre esplicitamente, sulla tecnica del Pepper's Ghost 
(figura 2). 

Analogamente, le varie piramidi olografiche non 
sono altro che un insieme di quattro Pepper's Ghost 
illuminati opportunamente da uno schermo, magari 
di un tablet (figura 3). 

Anche in questo caso si deve riconoscere che, oltre 
a gadget tecnologici, si trovano sistemi professionali 
con i quali si ottengono risultati di qualità. 

Ma non è olografia. 
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2.3 HoloLens e HMD 

Recentemente Microsoft ha presentato gli Holo- 
Lens[7], occhiali per la realtà aumentata. 

Dal punto di vista della mera visione, essi sono de¬ 
gli HeadMount Display (HMD) sulle cui lenti viene 
proiettata una coppia di immagini stereoscopiche 
che pertanto si vedono traslucide, tridimensionali e 
intarsiate nel modo reale che si intravede attraverso 
le lenti trasparenti degli occhiali. Siamo quindi nel 
campo della stereoscopia tradizionale. 

Tutto quanto sta attorno a questo e che è indispen¬ 
sabile per ottenere il risultato voluto, in particolare 
il riconoscimento e la modellizzazione 3D in tempo 
reale dell'ambiente in cui ci si trova, l'integrazione 
con dati provenienti dall'esterno via collegamento 
wireless, eccetera, sono senz'altro elementi tecno¬ 
logici che fanno degli HoloLens il terminale di un 
apparato molto complesso e sicuramente all'avan¬ 
guardia. 

Ma non è olografia. 

Fig. 4- Schema di funzionamento della tecnica 
olografica tradizionale [10] 


3. La vera olografia 

Per incontrare l'olografia vera bisogna guardare a 
laboratori di ricerca molto avanzati quali, per esem¬ 
pio, il mitico Massachusetts Institute of Technology 

(M/T) Nota2 [2]. 

L'olografia è una tecnica per memorizzare su un 
supporto bidimensionale l'intensità e la fase del 
fronte d'onda emesso da una scena tridimensionale. 

Fino ad alcuni anni fa l'unico modo per realizzare 
tale processo consisteva nel creare delle frange di 
interferenza su una lastra fotografica utilizzando 
un sistema ottico. Sostanzialmente si tratta della 
tecnica di Gabor migliorata e modificata da Emmett 
Leith e Juris Upatnieks [8][9] (figura 4). 

La visualizzazione si ottiene proiettando un fascio 
laser con le stesse caratteristiche di quello usato in 
ripresa, attraverso la lastra fotografica contenente 
l'ologramma (figura 5). Il video reperibile in [12] 
mostra chiaramente il funzionamento delle tecnica 
tradizionale. 

Fig. 5- Riproduzione olografica (NB: il modellino di 
auto non è presente, quello che si vede è la 
sua riproduzione olografica) [11] 




Nota 2 Ovviamente il MIT non è il solo centro di ricerca avanzato in tema di olografia: negli USA è molto attivo 
anche il College of Optical Science dell'Università dell'Arizona (L/A) ( httDs://radio.azDm.ora/s/14229-ua - 
researchers-pursuina-holoaraphic-displavA : in Europa si segnala l'attività del Fraunhofer-Gesellschaft 
( http://www.f raunhofer.de) : in Italia si può citare l'Istituto Nazionale di Ottica (INO - http://www.ino.itA del 

Consiglio Nazionale delle Ricerche (CNR). 
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Fig. 6- Riprese olografiche 
con MS Kinect 
camera (immagine 
tratta da[13]) 



Tale tecnica è diffìcilmente applicabile in esterno e 
non è adatta a riprendere oggetti di grandi dimen¬ 
sioni. In più la memorizzazione dell'ologramma su 
una lastra fotografica non è evidentemente adatta 
per immagini in movimento, mentre gli odierni 
sensori elettro-ottici non hanno la risoluzione ne¬ 
cessaria. Complessivamente si tratta di un metodo 
poco pratico per riprese di tipo televisivo. 

Al giorno d'oggi, però, le potenze di calcolo rese 
disponibili dai moderni computer offrono la pos¬ 
sibilità di generare gli ologrammi anche con pro¬ 
cedimenti numerici (DH, Digital Holography; CGH, 
Computer Generateci Holography), consistenti nel 
calcolare le frange di interferenza tramite algoritmi 
matematici a partire da un modello rappresentativo 
in qualche modo dell'oggetto ripreso. 

In alcuni casi si tratta di immagini particolari, per 
esempio mappe di profondità (usate al MIT), oppu¬ 
re un insieme di immagini convenzionali (metodo 
preferito all'UA). 

In particolare ([14], [15], [16] - figura 6), al MIT utiliz¬ 
zano una TOF ( Time Of Flight) camera (nello speci¬ 
fico una Kinect di Microsoft) per produrre in tempo 
reale una mappa di profondità della scena ripresa e 
da essa un algoritmo di simulazione ricava le frange 
di interferenza che vanno a comporre l'ologramma 
digitale; la problematica della capacità di calcolo 
richiesta è stata superata economicamente adot¬ 
tando delle comuni GPU (GraphicProcessor Unit). 


Presso l'Università dell'Arizona ([17], [18]) usano, 
invece, un altro metodo, ricavando un modello 
tridimensionale dell'oggetto ripreso tramite una 
schiera di telecamere ubicate tutt'attorno all'og¬ 
getto stesso ([19]). 

In ambedue i casi, in linea di principio, si possono 
utilizzare i canali trasmissivi convenzionali per 
trasferire le informazioni necessarie a generare 
l'ologramma da parte di un ricevitore equipaggiato 
con una potenza di calcolo sufficiente. 

Si noti che in questo caso si potrebbe, sempre in 
linea di principio, ottenere anche una forma di com¬ 
patibilità con altri tipi di visualizzatori volumetrici, 
per esempio autostereoscopici, o addirittura con 
display convenzionali 2D. 

Anche nel campo dei display MIT e UA adottano 
tecnologie differenti che mostrano caratteristiche 
diverse: maggiore economicità e frame rate quasi 
televisivi per la tecnologia del MIT, maggiore defi¬ 
nizione quella dell'UA. 

Nella tecnica del MIT le figure di interferenza cal¬ 
colate sono "caricate"su modulatori spaziali di luce 
(SLM, Spadai Light Modulator) per la successiva 
ricostruzione olografica, mentre nella tecnica svilup¬ 
pata all'UA l'ologramma è memorizzato su una lastra 
di materiale polimerico riscrivibile appositamente 
sviluppato ([20], [21], [22]). 
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Fig. 7- Modulatore spaziale di luce 
sviluppato presso il MIT 
(immagine tratta da [26] ) 



di luce sviluppato presso il MIT 
(immagine tratta da [25]) 


Lo schermo olografico adottato al MIT è il frutto di 
un lavoro di sviluppo decennale iniziato da S. Ben- 
ton e proseguito sotto la guida di V. M. Bove ([23], 
[24], [25], [26]). 

L'ultima versione del display, denominata "Mark 
III", adotta un modulatore composto da un piccolo 
cristallo di niobato di litio (figure 7 e 8). 

Opportuni elettrodi generano, sfruttando la piezo- 
elettricità del materiale, delle onde acustiche, cioè 
delle vibrazioni meccaniche, le quali modificano 
la disposizione spaziale degli atomi del cristallo, 
variando così l'indice di diffrazione delle guide 
d'onda ottiche in cui è incanalato il flusso luminoso. 


Proiettando la luce in uscita dal modulatore su una 
lastra di vetro diffondente si ottiene l'immagine 
olografica. 

I pixel così realizzati hanno dimensioni paragonabili 
a quelle della luce, come richiesto dalla tecnica olo¬ 
grafica per ottenere le figure di diffrazione deside¬ 
rate e l'immagine è modificabile nel tempo ad una 
frequenza relativamente elevata (15 Hz). 

Si possono utilizzare luci di illuminazione di colori 
diversi, in particolare i tre primari colorimetrici, ot¬ 
tenendo olografie a colori. Non ultimo, sia il modu¬ 
latore, sia il sistema complessivo sono relativamente 
economici e di piccole dimensioni. 
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L'Università dell'Arizona ha invece sviluppato un 
display costituito da materiale polimerico (figura 
10) capace di registrare l'ologramma digitale alla 
frequenza di 0.5 Hz, notevolmente inferiore a quello 
del MIT, ma mostrando una qualità desisamente 
superiore (si paragoni la figura 9 con la figura 1 1). 


■HHHHHj {mR; ^ Fig. 10- Display sviluppili.' 

presso la UA 

■Ffr ' ; (immagine tratta da 

MWbMI JJr [19D 


Fig. 11- Esempio di ologramma 
prodotto presso l'UA 
(immagine tratta da 
[ 2 ]) 
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I sistemi sviluppati al MIT e all'UA sono relativamen¬ 
te economici e di piccole dimensioni, tuttavia le 
immagini olografiche create con metodi numerici, 
in particolare quelle proiettate dinamicamente, in 
genere mostrano ancora alcuni limiti, come risulta 
evidente dalle figure 9, 10 e 11 : 

• Scarsa qualità dell'immagine, in particolare: 
presenza di macchie, elevato rumore, scarso 
contrasto e scarsa risoluzione; 

• Immagini monocromatiche, con i procedimenti 
numerici diventa maggiormente difficile, a 
livello di sistema, ottenere ologrammi a colori; 

• Angolo di visione ridotto, in linea di massima 
i modulatori hanno pixel di dimensioni molto 
maggiori delle lunghezze d'onda e questo 
implica che la visione tridimensionale possa 
avvenire solo in un angolo di visione estrema- 
mente limitato, inferiore a quello necessario per 
illuminare i due occhi; 

• Ridotte dimensioni dell'immagine, la dimen¬ 
sione dell'immagine va determinata come 
compromesso con l'angolo di visione; 

• Immagini poco dinamiche, a causa dell'elevata 
potenza di calcolo richiesta per calcolare gli 
ologrammi e per trasferire la mole di dati al 
modulatore ottico; 

• Mancanza di interattività, siccome l'immagine 
tridimensionale ricostruita appare tra l'utente 
e il modulatore, la sua posizione relativa al 
mondo circostante varia a seconda della posi¬ 
zione dell'utente. Ciò rende impossibile ogni 
interazione immersiva nell'immagine olografica. 

La tecnologia olografica è ancora immatura e la 
qualità complessiva delle immagini olografiche è 
ancora molto lontana da quella cinematografica 
o anche solo televisiva, ma le apparecchiature e 
il procedimento per la realizzazione di ologammi 
stanno diventando più economici e applicabili nel 
mondo reale (vedi anche [27], [28]). 


4. Conclusioni 

Spesso si usa a sproposito la parola olografia per 
indicare sistemi di proiezione commerciali, magari 
capaci di produrre spettacoli visivi molto coinvol¬ 
genti e di elevata qualità, ma basati su tecniche 
diverse dall'o/ografia vera e propria sviluppata da 
Gabor nel 1947. 

Alcuni centri di ricerca molto avanzati continuano a 
lavorare migliorando la tecnica olografica con lo sco¬ 
po di ridurne la complessità sistemistica ed il costo. 

In fase di ripresa la tendenza attuale sembra quella 
di evitare la tradizionale tecnica ottica per la gene¬ 
razione delle frange di interferenza che compon¬ 
gono l'ologramma, ottenendolo, invece, tramite 
simulazione al calcolatore (DH, Digital Hologaphy); 
in letteratura si è trovata indicazione di due metodi: 
uno basato su mappa di profondità (MIT), un altro su 
riprese multivista dell'oggetto ripreso (UA). 

In fase di riproduzione la ricerca è incentrata sullo 
sviluppo di modulatori di luce caratterizzati da 
pixel di dimensioni molto ridotte - dell'ordine della 
lunghezza d'onda - capaci di supportare ologrammi 
variabili nel tempo a frame rate televisivi e ovvia¬ 
mente a colori, con una buona risoluzione e qualità 
visiva. Il tutto a costi ridotti. 

Come riportato nel paragrafo precedente, i risultati 
finora ottenuti non mostrano ancora una qualità 
paragonabile a quella ottenibile con tecniche ci¬ 
nematografiche o televisive.Tuttavia, le tecniche di 
generazione digitale dell'ologramma permettono di 
eliminare molti dei problemi legati all'applicazione 
pratica della tecnica di ripresa tradizionale. Inoltre i 
modulatori ottici di più recente realizzazione risul¬ 
tano essere relativamente economici, anche se non 
sono ancora in grado di competere con le tecniche 
di visualizzazione tradizionali per quanto riguarda 
la qualità dell'immagine. 

Complessivamente quindi le ricerche sulla tecnica 
olografica stanno avvicinando la tecnica olografica 
alle condizioni di pratica realizzabilità, anche se la 
strada per ottenere apparati di consumo sembra 
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ancora lunga. 

Vi sono poi delle considerazioni, valide per ogni 
visualizzatore tridimensionale, relativeal linguaggio 
per immagini [?]. 

In una visualizzazione stereoscopica ogni spettatore 
vede la stessa immagine anche perché essa è ripresa 
dallo stesso punto di vista. Al contrario, spettatori 
che assistono ad una visualizzazione tridimensio¬ 
nale, in particolare olografica, vedono l'oggetto 
riprodotto da punti di vista differenti a seconda della 
loro posizione rispetto aN'immagine - d'altronde 
è esattamente ciò che ci si ripropone di ottenere 
con i visualizzatori volumetrici a partire dai display 
autostereoscopici, a quelli basati sull'integral ima- 
ging, ai display volumetrici veri e propri e in ultimo 
a quelli olografici. 

Tuttavia, nel campo fotografico e cinematografico 
l'inquadratura supporta il messaggio: riprendendo 
un primo piano di una persona, per esempio un 
interlocutore in un dialogo, una cosa è vederlo 
frontalmente, altra è osservarlo da una posizione 
laterale rispetto alla testa (p.es. 90°) o addirittura 
da dietro (180°). 

Ci pare di poter sostenere che in questo caso il 
linguaggio per immagini derivi direttamente dalla 
nostra fisiologia e dalle abitudini comportamentali: 
non per nulla da piccoli ci viene insegnato come 
rapportarci ai nostri interlocutori e il nostro atteggia¬ 
mento verso essi fa parte di quella comunicazione 
non verbale che a volte è molto più significativa di 
quella verbale. 

Quindi, davanti ad un display volumetrico è possibi¬ 
le che due utenti, magari seduti sullo stesso "divano 
del soggiorno", vedano due inquadrature diverse 
della stessa scena e conseguentemente ne ricavino 
messaggi differenti. Come si deve regolare il regista 
del film per veicolare lo stesso messaggio ai due 
utenti? Oppure possono nascere nuove modalità e 
nuove opportunità di espressione multimediale? In 
teoria potrebbe essere, ma si ha l'impressione che 
gestire tale possibilità sia piuttosto arduo. Senza 
contare che, come prima accennato, qualora si 


considerino riprese soggettive o pseudo-soggettive, 
l'orientamento relativo dei soggetti ripresi supporta 
un significato che si rifà a consuetudini oseremmo 
dire derivate dalla nostra fisiologia piuttosto che 
ad un linguaggio convenzionale e che pertanto 
non deve essere stravolto dalle modalità di visua¬ 
lizzazione. 

Pertanto, si ritiene che l'opportunità di utilizzare 
i display volumetrici in campo cinematografico e 
televisivo sia tutta da valutare. Tuttavia essi sono 
gli unici sistemi di visualizzazione tridimensionale 
multi utente che non necessitano di occhiali specifici 
e quindi la loro evoluzione è senz'altro da conside¬ 
rare con attenzione. 
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1. Introduzione 

Nel 1993 con il DVB-S, e poi di nuovo nel 2003 con 
il DVB-S2 [1], gli standard satellitari DVB hanno 
contribuito alla definizione di una famiglia di stan¬ 
dard digitali, rispettivamente di prima e seconda 
generazione, indirizzando le scelte tecnologiche 
degli standard DVB per la trasmissione sul canale 
terrestre e via cavo. 

Nel febbraio 2014, a circa 10 anni dalla nascita del 
sistema DVB-S2, il consorzio DVB ha approvato 
l'estensione dello standard DVB-S2, indicata con il 
nome DVB-S2X (52 eXtensiorì) [2], per migliorare le 
prestazioni nei segmenti di mercato di riferimento 
del DVB-S2, quali la diffusione televisiva, la contri¬ 
buzione, le applicazioni DSNG {Digital Satellite News 
Gathering) e la trasmissione di dati per le reti a larga 
banda, ed espandere il campo di applicazione a mer¬ 
cati ad oggi meno strategici ma in forte espansione, 
quali il settore mobile (aereo, ferroviario e navale) 
e quello delle applicazioni professionali tipo VSAT 
(Very Small Aperture Terminal) in regioni caratteriz¬ 
zate da elevate attenuazioni del segnale ricevuto, a 
causa delle perturbazioni atmosferiche. 

Lo standard DVB-S2, ETSI EN 302 307 risulta dunque 
ora suddiviso in 2 parti, di cui la Parte I, ETSI EN 302 
307-1 [3] è normativa e contiene la specifica del 
DVB-S2 originale, e la Parte II, ETSI EN 302 307-2 [4], 
è opzionale e definisce il sistema DVB-S2X. 

A pochi mesi dalla standardizzazione, i primi appa¬ 
rati a standard DVB-S2X sono già disponibili sul mer- 


Nel febbraio 2014 lo steering board del DVB ha 
approvato una estensione dello standard DVB-S2, 
denominata DVB-S2X (S2 eXtensions), che è stato 
pubblicato come Parte II dello standard EN 302 307. 
La Parte I del medesimo standard contiene ora la 
specifica del DVB-S2 originale. 

Il DVB-S2X offre nuove configurazioni e prestazioni 
migliorate per gli scenari del DVB-S2 (DTH, bro¬ 
adband e interattività, DSNG e applicazioni profes¬ 
sionali, contribuzione e distribuzione TV) ed estende 
i modi di funzionamento per coprire nuovi mercati 
emergenti come il settore mobile. 

Il 21 ottobre 2014 dal Cen tro Ricerche Rai di Torino è 
stata effettuata la prima trasmissione di un segna¬ 
le a standard DVB-S2X, contenente un flusso di 
immagini di test in 4k (UHD, Ultra High Definition) 
codificate utilizzando il nuovo standard di compres¬ 
sione HEVC (High Efficiency Video Coding). 

L'articolo descrive le principali caratteristiche del 
sistema DVB-S2Xe fornisce alcuni dettagli relativi 
alla trasmissione sperimentale sopra citata. 
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cato. Ciò ha reso possibile effettuare, il 21 ottobre 
2014 dal Centro Ricerche Rai, la prima trasmissione 
sul satellite Eutelsat 5W di un segnale a standard 
DVB-S2X. Per l'occasione si è deciso di trasmettere 
un flusso di immagini di test in 4k, a dimostrare la 
perfetta sintonia di due nuove tecnologie per la 
televisione di un futuro molto prossimo. 

2. Principali caratteristiche del sistema 
DVB-S2X 

Lo standard DVB-S2X consente di operare in ambiti 
di interesse consolidati come la diffusioneTV (DTH, 
Direct To Home), le applicazioni interattive a larga 
banda per l'utenza domestica e professionale, il 
DSNG e altre applicazioni professionali, la contri¬ 
buzione e distribuzioneTV, la distribuzione dati e di 
siti internet (InternetTrunking), ma introduce anche 
nuove configurazioni rivolte a nuove aree di interes¬ 
se; infatti il nuovo sistema è in grado di funzionare 
anche in condizioni di rapporto segnale-rumore 
non convenzionali, ed in particolare in condizioni di: 

• bassissimo rapporto segnale-rumore (VL-SNR, 
Very-Low SNR): da -3 fino a -10dB, tipico in 
regioni caratterizzate da elevate attenuazioni 
del segnale ricevuto a causa delle perturbazioni 
atmosferiche, come ad esempio le zone tropicali 
in particolare per la banda Ka, e dei servizi verso 
terminali mobili (aerei, treni veloci, navi e simili); 


• altissimo rapporto segnale-rumore (VH-SNR, 
Very-High SNR): oltre i 12 dB, per applicazioni 
professionali ad elevata efficienza spettrale 
(arrivando ad efficienze spettrali di circa 6 bps/ 
Hz usando una modulazione 256APSK). 

Nel seguito vengono riassunti i principali elementi 
innovativi dello standard DVB-S2X a confronto con 
il DVB-S2. Per maggiori informazioni sull'uso del 
sistema nei vari scenari applicativi, è possibile fare 
riferimento a [5], 

2.1 II livello fisico 

Il nuovo sistema DVB-S2X conserva la stessa archi¬ 
tettura generale del DVB-S2 (figura 1 ), nonché tutte 
le configurazioni, in modo da garantire la compati¬ 
bilità con i segnali di tipo DVB-S2, oltre che per una 
veloce e facile immissione sul mercato. 

2.1.1 Nuovi MODCOD 

Come per il DVB-S2, anche nel DVB-S2X la trasmis¬ 
sione dati è protetta dalla concatenazione di 2 codici 
correttori FEC (ForwardErrorCorrection), il codice in¬ 
terno LDPC (LowDensity Parity Check) e il BCH (Rose 
ChaudhuriHocquenghem) esterno, ed è basata sulle 
costellazioni APSK (Amplitude PhaseShift Keying). 

Per quanto riguarda la lunghezza di blocco del co¬ 
dice LDPC, oltre al blocco lungo (64800 bit) e corto 


Fig. 1 - Schema a blocchi funzionale del sistema DVB-S2/S2X: sono evidenziate in rosso le 
estensioni più significative del DVB-S2X 
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modi VL-SNR. 


(16200 bit), già presenti nel DVB-S2, per i quali ven¬ 
gono definiti nuovi code rate, sono introdotte alcune 
configurazioni con blocco medio, da 32400 bit. 

Oltre alle costellazioni QPSK, 8PSK, 16APSK e 
32APSKdel DVB-S2, sono state aggiunte nuove con¬ 
figurazioni 8APSK, 16APSK e 32APSK (figura 2), più le 
nuove 64APSK(fìgura 3), 128APSKe256APSK(figura 
4) per le applicazioni broadband e professionali, 
e la 7i/2-BPSK, in associazione con uno spreading 
di un fattore 2 per i rate di codifica più bassi, per i 


Alcune di queste configurazioni (indicati nello 
standard dal suffisso "-L" in cascata al loro nome) 
sono state specificatamente definite per l'utilizzo 
su canale lineare e sono utilizzabili ad esempio per 
trasmissioni in configurazioni multi portante MCPC 
(Multiple Carrier Per Channel). Il guadagno offerto 
da questi MODCOD rispetto ai corrispettivi per il 
canale non-lineare può arrivare anche fino ad 1 dB, 
per la stessa efficienza spettrale. 
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Le nuove configurazioni di modulazione e rate 
di codifica (MODCOD) offerte sono pari a circa il 
doppio rispetto ai modi presenti nel DVB-S2. Ciò 
consente di ottenere una maggiore granularità nel 
piano efficienza spettrale/rapporto segnale-rumore, 
come si può vedere in figura 5, per un modello sem¬ 
plificato di canale non-lineare di tipo Hard Limiter, 
nell'intervallo di rapporti segnale rumore tipici delle 
applicazioni broadcast, e figura 6, su canale lineare, 
per tutto l'intervallo di rapporti segnale-rumore 
coperti dal DVB-S2X. 

2.1.2 Nuovi roll-off più stretti 

Per ridurre l'occupazione in frequenza del segnale, 
e consentire maggiore flessibilità di configurazione 
del sistema a seconda delle esigenze operative, 
l'S2X introduce nuovi valori di roll-off più piccoli 
(15%, 10% e 5%) in aggiunta a quelli già presenti 
nel DVB-S2 (35%, 25%, 20%). 

In [4] è illustrato che il guadagno ottenibile me¬ 
diante l'uso di roll-off più stretti dipende molto 
dalla flessibilità dell'operatore satellitare nel poter 
modificare i vincoli su symbol-rate e maschere di 
emissione. Se non ci sono vincoli sul symbol-rate 
utilizzabile, il benefìcio offerto dai roll-off più stretti 
per ottimizzare l'efficienza spettrale di un tipico 
schema di trasmissione è minimo. Ciononostante, 
l'utilizzo dei roll-off più stretti può essere utile per 
il controllo dell'interferenza sui canali adiacenti 
dovuto all'aumento del symbol-rate. 
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Fig. 5 - Efficienza spettrale di DVB-S2 
e DVB-S2X a confronto 
nell'intervallo di valori di 
rapporto segnale rumore tipici 
dei servizi diffusivi DTH. Si noti 
che è stato selezionato un 
roll-off del 5% sia per l'S2 che 
per l'S2X (anche se l'S2 prevede 
roll-off minimo del 20%). 
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2.1.3 II VCM diventa normativo anche per il DTH 

L'S2X rende anche normativa la modalità VCM {Va- 
riabte Coding and Modulation) per tutti gli scenari 
applicativi: nel DVB-S2, per il DTH la modalità nor¬ 
mativa era CCM, Constant Coding and Modulation, 
mentre il VCM era opzionale. In questa maniera, 
variando la configurazione del sistema, e quindi la 
protezione sul segnale, frame per frame, è possibile 
utilizzare il giusto compromesso fra robustezza 
del segnale ed efficienza spettrale, sulla base degli 
specifici requisiti dei servizi trasmessi. 


Fig. 6 - Confronto tra DVB-S2 e DVB-S2X 
nel piano efficienza spettrale 
verso C/Nref, su canale lineare, 
per tutte le configurazioni 
MODCOD di sistema 

2.1.4 II PLHEADER 

Come per il DVB-S2, il Frame di livello fìsico (PL- 
FRAME) è preceduto da un Physical Layer Header 
(PLHEADER), la cui funzione è quella di trasportare 
i bit necessari alla sincronizzazione dei dispositivi 
riceventi con il segnale trasmesso e informazioni 
aggiuntive come la lunghezza del frame dati, la 
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presenza di simboli pilota perfacilitare la sincroniz¬ 
zazione del ricevitore e lo schema di modulazione e 
codifica utilizzato; per segnalare i nuovi MODCOD 
il numero di bit del PLHEADER è stato incrementato 
da 7 a 8. Inoltre, in associazione ai MODCOD VL-SNR 
è prevista la trasmissione, in coda al PLHEADER, di 
un header speciale (VL-SNR Header), in grado di 
garantire la sincronizzazione su terminali mobili 
operanti in VL-SNR, oltre che l'identificazione del 
MODCOD utilizzato. 

2.1.5 Le sequenze di scrambling 

Per mitigare l'interferenza co-canale, l'S2X affianca 
6 nuove sequenze di scrambling alla sequenza del 
DVB-S2 nelle applicazioni DTH. In alcuni casi speci¬ 
fici, infatti, già oggi si verificano situazioni di elevata 
interferenza co-canale (CCI, Co-Channel hnterferen- 
ce), e si prevede che possa diventare sempre più 
frequente in futuro nelle configurazioni satellitari 
multi-spot (specialmente in banda Ka). 

2.2 I LIVELLI SUPERIORI 

Anche ai livelli protocollari superiori, il DVB-S2X 
introduce nuove funzionalità, che consentono di 
aumentarne la flessibilità e le prestazioni. In parti¬ 
colare, si introduce il concetto di channel bonding, 
per suddividere un grande flusso trasmissivo su più 
transponder satellitari e l'uso di nuovi protocolli di 


trasmissione per IP (GSE- Generic Stream Encapsu- 
lator, GSE-lite). 

Infine, il nuovo standard definisce una nuova strut¬ 
tura opzionale di Super-Frame, per permettere in 
futuro trasmissioni multi-formato capaci di garantire 
forti guadagni in termini di capacità e flessibilità del 
sistema e favorire lo sviluppo di tecniche avanzate 
(mitigazione dell'interferenza, beam-hopping, ecc.) 
per migliorare in modo significativo le prestazioni 
su reti per servizi interattivi a banda larga. 

3. Prima trasmissione DVB-S2X 

Il 21 ottobre 2014 dal Centro Ricerche Rai diTorino 
è stato trasmesso il primo segnale a standard DVB- 
S2X, contenente un flusso di immagini di test in 
4k (UHD, Ultra High Definition) utilizzando il nuovo 
standard di compressione HEVC ( High Efficiency 
Video Coding). 

IITransport Stream, realizzato presso i laboratori del 
CRIT, è stato inviato al modulatore DVB-S2X Newtec 
MDM6100, che generava il segnale in banda IF a 
70MHz.Tale segnale veniva trasferito alla Stazione 
Mobile ITA646 mediante la quale si è effettuato l'up- 
link verso il satellite Eutelsat 5W, transponder KB11. 
Tale satellite ha su Torino 6 dB di G/T e 53 dBW di 
EIRP come illustrato in figura 7. 



Fig. 7- EIRP del satellite Eutelsat 5W 
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La costellazione scelta è stata il 16APSK con codice 
di correzione di errori (FEC) 26/45 per un'efficienza 
spettrale risultante pari a 2,46 bit/s/Hz. Il roll-off 
utilizzato è stato del 5%. 

Avendo a disposizione una banda di 18MHz, si è 
adottato un Symbol rate di 17 Mbaud, in grado di 
trasportare, con i parametri scelti, fino a 41,8 Mbit/s. 

Per la ricezione si è utilizzata una parabola da 90 
cm, sufficiente per ricevere il segnale proveniente 
dal satellite Eutelsat 5W con un ampio margine di 
ricezione. Durante la trasmissione il demodulatore 
DVB-S2X utilizzato, Newtec MDM6100, indicava in¬ 
fatti un margine di ricezione intorno ai 6dB, in linea 
con quanto previsto in base al link budget. 

Non essendo ancora disponibili dei ricevitori com¬ 
merciali 4k dotati di demodulatori DVB-S2X l'uscita 
TS del demodulatore professionale utilizzato per 
ricevere il segnale dal satellite Eutelsat 5W è stato 
rimodulato in DVB-S e per poter utilizzare un TV 4k 
dotato di un classico ricevitore DVB-S. 

Lo schema di principio relativo alla trasmissione 
DVB-S2X è riportato in figura 8. 


Fig. 8 - La dimostrazione DVB-S2X HEVC 



Sorgente; 

TS4K HEVC VII 
28 Mbit/s 
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1. Introduzione 


Negli ultimi anni il modo in cui gli utenti fruiscono 
del contenuto televisivo è radicalmente cambiato. 
Il processo di digitalizzazione dei contenuti e delle 
trasmissioni ha permesso una notevole evoluzio¬ 
ne dell'ecosistema televisivo verso nuove forme 
di fruizione, navigazione e interazione. Possiamo 
inoltre notare profondi cambiamenti anche nelle 
caratteristiche tipiche dell'ambiente all'interno del 
quale i contenuti sono fruiti: sempre più spesso gli 
utenti guardano i contenuti televisivi utilizzando al 
tempo stesso dispositivi mobili come smartphone 
e tablet per interagire, commentare e approfondire 
i programmi che vengono trasmessi dai broadcaster 
[5][3]. La popolarità dei social network ha modificato 
l'ecosistema Web verso un ambiente più collabo¬ 
rativo e dove l'importanza dei contenuti generati 
dall'utente diventa sempre maggiore. L'analisi di 
questi contenuti certamente non può rappresen¬ 
tare in senso stretto un campione statisticamente 
rappresentativo della società, ma certamente deve 
essere tenuto in considerazione da tutti gli attori 
per poter cogliere tendenze, popolarità e opinioni 
di una parte di utenti che non può essere trascurata. 

Tipicamente il contenuto televisivo prodotto e 
messo in onda dal broadcaster viene arricchito 
con descrizioni in linguaggio naturale e metadati e, 
successivamente, memorizzato in maniera statica in 
archivio per successivi riutilizzi. Il broadcaster può, 
inoltre, offrire online i contenuti TV attraverso un 
proprio portale Web; operazioni altrettanto tipiche 


L'articolo descrive i risultati ottenuti nell'ambito 
della collaborazione tra il Centro Ricerche RAI e il 
Dipartimento di Informatica dell'Università degli 
Studi di Torino nella definizione di un modello di 
integrazione di dati eterogenei provenienti da 
differenti basi di conoscenza (archivi televisivi, ERG, 
audience, social networks, ecc) che contribuiscono 
alla definizione della "seconda vita" del contenuto 
televisivo, a partire dalla sua produzione, la succes¬ 
siva messa in onda e proseguendo con i commenti e 
contenuti generati sul web dagli utenti. 

Il modello proposto permette di rappresentare 
attraverso un unico grafo di conoscenza le differenti 
entità e relazioni che emergono dal dominio televi¬ 
sivo analizzato. 
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sono l'analisi dell'audience allo scopo di quantificare 
l'indice di gradimento della trasmissione oppure 
l'analisi degli accessi al proprio sito Internet. Cosa 
succede in seguito? Molti dei programmi messi in 
onda, nella fattispecie quelli più interessanti, ven¬ 
gono ripubblicati in rete, in tutto o in parte, dagli 
utenti stessi (ad esempio su YouTube), durante e 
dopo la messa in onda i contenuti televisivi vengo¬ 
no commentati dagli utenti sui principali portali di 
social network, come Facebook eTwitter, dando vita 
anche ad intensi dibattiti sulla rete. 

Per i contenuti TV inizia quindi una seconda vita 
durante la quale il contenuto audio/video viene 
guardato, "taggato", "apprezzato", commentato e 
condiviso più e più volte, trasformandosi in una 
"calamita" in grado di attrarre utenti del Web e di¬ 
ventando in sostanza un Oggetto Sociale che veicola 
emozioni, pareri, argomenti di discussione: l'analisi 
di tali contenuti può aiutare i diversi attori a quanti¬ 
ficare la popolarità dei personaggi e dei programmi 
televisivi, i trend e il gradimento del pubblico. 

L'attività di collaborazione del Centro Ricerche 
RAI con l'Università degli Studi di Torino oggetto 


di questo articolo mira alla definizione di un fra- 
mework di integrazione di dati eterogenei prove¬ 
nienti da sorgenti sia tradizionali che sociali. Il siste¬ 
ma definito permette di rappresentare in un unico 
modello unificato la conoscenza proveniente dalle 
diverse sorgenti analizzate, abilitando innovativi 
strumenti di ricerca e analisi inter-sorgente. 

2. Un framework per l'integrazione e 
l'analisi di dati sociali 

In questa sezione viene mostrata l'architettura del 
framework che permette l'integrazione di sorgenti 
eterogenee, sia sociali che tradizionali, in un'unica 
knowledge base. Essa si basa sulla definizione di un 
grafo di conoscenza che consente di rappresentare i 
concetti e le relazioni tra di essi attraverso un unico 
modello. 

In figura 1 è rappresentata l'architettura generale 
del framework di integrazione. Esso è composto 
da tre livelli principali: il Source Processing Layer, il 
Knowledge Graph Layer e il Knowledge Query and 
Analysis Layer. 
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Fig. 1 - Architettura del sistema 
di integrazione e analisi 
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2.1 II Source Processing Layer 

Il primo livello dell'architettura ha il compito di 
collezionare tutti i dati dalle sorgenti in ingresso, 
dati che saranno successivamente memorizzati nel 
grafo di conoscenza, cuore del framework proposto 
in questo articolo. Esso accede continuamente ad 
un numero predefinito di sorgenti, siano esse siti 
web, social networks, metadati che descrivono i 
programmi TV, e, attraverso una serie di moduli di 
analisi, estrae le unità informative che andranno a 
formare i nuovi nodi e relazioni all'interno del grafo 
di conoscenza. Il modulo denominato Schedule 
Analyzer ha il compito di leggere le informazioni 
del palinsesto televisivo e di orchestrare i diversi 
estrattori in base, ad esempio, ai programmi in onda. 

Ogni sorgente è associata ad un estrattore che ha 
come input lo stream di dati generati dalla sorgente 
stessa (ad esempio i tweet associati al talk show te¬ 
levisivo Ballarò, o i post e i commenti presenti nella 
pagina Facebook del programma) e produce come 
risultato l'insieme dei concetti (personaggi, luoghi, 
eventi, utenti, emozioni, ecc) unitamente alle rela¬ 
zioni che li legano. Come vedremo nella sezione 
successiva, il grafo di conoscenza rappresenta un 
modello temporale dei dati provenienti dalle diverse 
sorgenti analizzate e quindi permette di memorizza¬ 
re al suo interno l'evoluzione dei fenomeni osservati. 
Per fare ciò, ogni analizzatore divide il flusso di dati 
in finestre temporali e, attraverso una fase di analisi, 
estrae l'insieme di entità più rilevanti, collegandole 
tra loro attraverso opportune relazioni, in modo da 
formare una nuova porzione del grafo, annotata 
temporalmente, che nella sezione successiva verrà 
identificato come Oggetto Sociale. E' importante 
notare come la dimensione della finestra temporale 
scelta può variare in funzione del contesto di analisi: 
è possibile decidere, ad esempio, di diminuire l'am¬ 
piezza della finestra temporale durante la messa in 
onda del programma per poter modellare i fenome¬ 
ni sociali con una granularità maggiore, rispetto ai 
momenti in cui lo stesso programma non è in onda 
e quindi è, presumibilmente, meno commentato. 

Per la fase di estrazione delle informazioni dal flusso 
di dati, il sistema si affida ad una serie di moduli 


condivisi tra i vari estrattori che sono responsabili 
dell'esecuzione delle operazioni più comunemente 
utilizzate in questo ambito.Tra di essi possiamo tro¬ 
vare i moduli che svolgono i classici task dei sistemi 
di Information Extraction, quali: strumenti di analisi 
del testo, riconoscimento delle entità, analisi dei 
sentimenti. 

2.1.1 II riconoscimento delle entità 

Il modulo denominato Named-Entity Recognizer 
(NER) ha il compito, dato in input un tweet o un 
commento su YouTube, di riconoscere le entità no¬ 
minate (persone, luoghi, eventi) all'interno del testo. 
Possiamo individuare due fasi principali: individua¬ 
zione delle entità e disambiguazione delle entità [9], 
La prima fase è stata implementata attraverso l'uso 
sinergico di un modulo di analisi del testo, Freeling 
POS Tagger [13], coadiuvato dall'uso di Wikipedia 
come base di conoscenza strutturata. Il primo si 
occupa di riconoscere all'interno del testo le parti 
che fanno riferimento a nomi propri o comuni (es: 
"#barackobama""Matteo Renzi""Milano"), eliminan¬ 
do verbi, aggettivi, articoli, ecc., mentre Wikipedia 
viene utilizzata per ottenere un unico riferimento 
alle entità a partire da chiavi di ricerca differenti (ad 
esempio, "Renzi", "Matteo Renzi", "#renzi"). 

La seconda fase del modulo NER si occupa dell'ope¬ 
razione più importante che compete a questa unità 
di analisi: la disambiguazione. E'importante notare, 
infatti, che ad una singola chiave di ricerca spesso 
corrispondono più entità candidate. Questo può 
avvenire sia per casi di omonimia ("Paolo Rossi"può 
riferirsi ad un attore o ad un calciatore) o perché il 
nome del personaggio non è completamente spe¬ 
cificato ("Giannini"può riferirsi a Massimo Giannini, 
l'attuale conduttore del talkshowtelevisivo Ballarò, 
o all'attore Giancarlo Giannini). La maggior parte 
delle soluzioni proposte in letteratura si basano 
sul modello Bag ofWords, nel quale il processo di 
disambiguazione si basa sul calcolo della similarità 
tra i termini che precedono o seguono le entità 
da disambiguare. Come dimostrato in letteratura, 
queste tecniche sono inefficaci negli scenari, come 
quello considerato in questo articolo, caratterizzati 
da testi brevi e non sempre strutturati, come tweet 


32 


Elettronica e Telecomunicazioni N° 1/2015 


www.crit.rai.it 


o commenti su YouTube o Facebook. Per questa 
ragione, il modulo di disambiguazione proposto in 
questo articolo fa uso dei metadati che descrivono 
i programmi televisivi per cercare di stabilire quale 
tra i candidati restituiti dalla ricerca su Wikipedia rap¬ 
presenta l'entità che l'utente intendeva menzionare. 
Più in dettaglio, per ogni programma televisivo, 
è stato creato una mappatura con le categorie di 
Wikipedia all'interno delle quali ogni voce è cata¬ 
logata: il sistema quindi, tra i possibili candidati, 
prediligerà quelli le cui categorie saranno più simili 
a quelle associate al programma televisivo che si sta 
esaminando. Grazie a questo algoritmo, la chiave di 
ricerca "Paolo Rossi", menzionata all'interno di uno 
stream di Twitter de "La domenica sportiva" resti¬ 
tuirà come personaggio più probabile il calciatore; 
allo stesso modo, la ricerca del termine "Giannini" 
durante l'analisi del talk show"Ballarò"riconoscerà 
come entità più probabile l'attuale conduttore 
"Massimo Giannini". Inoltre, il sistema può essere 
proattivamente addestrato attraverso un sistema 
di supervisione guidato da un utente esperto del 
dominio. 

2.1.2 La sentiment analysis 

Il modulo di analisi dei sentimenti è responsabile 
dell'estrazione dei valori di polarità e delle emozioni 
dalle varie sorgenti analizzate. Dopo una fase preli¬ 
minare di estrazione dei lemmi, effettuata sempre 
con l'utilizzo di Freeling POS tagger, il sistema utiliz¬ 
za il vocabolario di SentiwordNet [1 ], eventualmente 
coadiuvato dall'utilizzo di MultiwordNet [14] per la 
traduzione, per estrarre il valore di polarità (positiva, 
negativa o neutra) eventualmente associato ad ogni 
singolo termine. Una funzione di aggregazione 
permette quindi di calcolare il valore complessivo 
della polarità dell'insieme dei dati prodotti dagli 
utenti nella finestra temporale esaminata. Un algo¬ 
ritmo analogo viene utilizzato per l'estrazione delle 
emozioni, basato in questo caso sulla tassonomia 
fornita da WordNetAffect [18], In questo modo ogni 
estrattore è in grado di associare ad ogni blocco di 
dati facente riferimento ad una specifica finestra 
temporale di uno specifico programma una rap¬ 
presentazione numerica delle opinioni degli utenti 
attivi sui social networks. 


2.2 II Knowledge graph layer 

Il successivo livello ( Knowledge Graph Layer) rap¬ 
presenta il cuore di tutto il sistema e permette di 
rappresentare i concetti e le relazioni estratti dalle 
diverse sorgenti eterogenee in un modello di cono¬ 
scenza unificato e omogeneo. Il modello proposto 
è una sintesi di consolidate teorie sociali proposte 
negli anni passati in differenti campi, quali le scienze 
cognitive [2] [10] [8] [17], la filosofia del linguaggio [15] 
e le ontologie sociali [6] [16], 

Sulla base delle teorie appena menzionate, pos¬ 
siamo quindi individuare tre entità principali, cor¬ 
rispondenti alle tre tipologie di nodi che sono alla 
base del grafo proposto: gli utenti che agiscono, 
i soggetti, il risultato delle loro azioni, gli oggetti 
sociali e la rappresentazione degli oggetti da loro 
menzionati, i concetti. Ogni atto (o insieme di atti) 
che un utente effettua nei social network analizzati 
e che produce un'evidenza sociale è rappresentato 
all'interno del grafo da un oggetto sociale. Un og¬ 
getto sociale permette di evidenziare una relazione, 
all'interno di uno specifico intervallo temporale, tra 
un insieme di concetti, siano essi personaggi, pro- 
grammiTV, luoghi, eventi, emozioni, ecc. In questo 
modo è possibile rappresentare, ad esempio, che il 
giornalista Ferruccio De Bortoli è tra i personaggi 
più nominati o che la paura è una delle emozioni 
prevalenti tra quelle veicolate dagli utenti di Twitter, 
durante un particolare intervallo temporale, rispetto 
ad una determinata puntata del talkshow"Ballarò". 

La struttura del modello prevede quindi la definizio¬ 
ne della tipologia di relazioni che permettono di le¬ 
gare soggetti, oggetti sociali e concetti. In particolare, 
un insieme di utenti (soggetti), che commentano un 
programma televisivo, supportano la creazione di un 
oggetto sociale; un oggetto sociale è la rappresenta¬ 
zione di una istanza sociale di uno o più concetti in 
un particolare contesto (ad esempio, un video può 
essere una rappresentazione di un evento sportivo). 
I concetti e, più in generale, le entità dello stesso tipo 
possono essere connesse tra loro al fine di creare 
strutture complesse: ad esempio, un commento 
ed un video sono due oggetti sociali che possono 
essere connessi da una relazione strutturale per 
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Fig. 2- Struttura generale del modello a grafo 


indicare che il primo è parte del secondo. Una tas¬ 
sonomia che classifica geograficamente i concetti 
che esprimono dei luoghi è connessa attraverso la 
stessa tipologia di relazione. La figura 2 riassume la 
struttura del grafo. 

Infine, è importante notare che gli oggetti sociali 
sono per loro natura transienti ed evolvono nel 
tempo. Per questo motivo, ogni oggetto sociale può 
essere caratterizzato attraverso un nodo temporale 
che esprime un intervallo di validità, connesso at¬ 
traverso una relazione di tipo temporale. 

La figura 3 nella pagina seguente mostra un caso re¬ 
ale della struttura del grafo di conoscenza utilizzato 
all'interno del sistema proposto. Si riferisce al risul¬ 
tato dell'analisi di due stream di dati provenienti da 
Twittereda YouTube relativi allo stesso programma 
TV (la telecronaca della finale dei 100 metri durante 
le Olimpiadi di Londra 2012). 

Come si può notare, i vari estrattori hanno permesso 
di individuare i personaggi più nominati dagli utenti 
all'interno di Twitter e dei commenti ad un video 
YouTube, il concetto relativo all'evento commentato 
e le emozioni veicolate nei commenti. Per ogni sor¬ 
gente, è stato creato un oggetto sociale complesso 
(TweetSet in un caso, YouTube Video nell'altro) che 
permette di legare gli utenti, classificati per tipologia 
(activeusers, supporters, broadcasters) ai concetti più 
rilevanti (Usain Bolt, Asafa Powell e altri). 


Come accennato precedentemente, è possibile 
notare come gli oggetti sociali acquistano una vali¬ 
dità temporale grazie alla presenza di una relazione 
temporale con un nodo che esprime un intervallo 
di tempo: in questo modo, dato un intervallo tem- 
poraledi interesse, il livello di query introdotto nella 
prossima sezione sarà in grado di individuare, ana¬ 
lizzare e restituire in maniera efficiente solamente 
i dati che sono validi in tale intevallo temporale. 

I concetti che sono rappresentazione comune di 
oggetti sociali provenienti dall'analisi di sorgenti 
differenti permettono, inoltre, di creare un ponte 
semantico tra i diversi media, abilitando quindi 
meccanismi di analisi inter-sorgente. 

Infine, la figura 3 permette di notare come il grafo 
memorizzi al suo interno solamente le relazioni 
più significative che emergono dall'analisi svolta 
dagli estrattori. Infatti, rappresentare ogni singola 
relazione e concetto, anche quelle meno frequenti, 
renderebbe non gestibile il modello nella successiva 
fase di analisi, senza apportare benefici evidenti ai 
risultati finali. 

Per l'implementazione del grafo di conoscenza 
descritto è stato scelto il database NoSQL Neo4j 
[11], che rappresenta una tra le tecnologie leader 
del settore. Neo4j permette di gestire agevolmen¬ 
te grandi quantità di nodi e relazioni e offre una 
comoda interfaccia di gestione basata su mecca¬ 
nismi standard (REST). Il linguaggio dichiarativo di 
interrogazione Cypher [4] rappresenta un efficace 
strumento di query basato sui meccanismi standard 
di gestione dei grafi. 
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Fig. 3 - Un esempio di estrazione e integrazione dei dati provenienti da due differenti social 
network (Twitter e YouTube) 
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2.3 II Query and analysis layer 

Il terzo livello del sistema proposto consiste in una 
serie di componenti responsabili deW'interrogazione, 
navigazione e analisi. 11 modulo di query permette di 
estrarre sottografì a partire dal grafo di conoscenza 
principale, in base a criteri e vincoli stabiliti dall'u¬ 
tente. Ogni sottografo estratto può essere conside¬ 
rato come una vista parziale dell'intero grafo conte¬ 
nente solo i nodi e le relazioni rilevanti per l'utente. 
Il modulo di analisi mette a disposizione dell'utente 
finale una serie di strumenti basati su algoritmi di 
data mining in grado di estrarre pattern ricorrenti, 
popolarità dei personaggi, emozioni emergenti e 
altro. Esso può agire direttamente sull'intero grafo 
o utilizzare le viste estratte con il modulo di query o 
ulteriori viste che possono essere interpretate come 
differenti strutture dati tipiche del data mining come 
matrici o tensori. 


3. Un caso di studio: i talk show politici 

In questa sezione viene descritta una particolare 
sperimentazione del framework proposto, basata su 
dati relativi alle puntate del programma RAI "Ballarò" 
andate in onda tra il 2 ottobre e il 27 novembre 2012. 
Il periodo selezionato è di particolare interessante 
perché molto ricco per quanto riguarda l'attività 
politica: tra gli eventi rilevanti possiamo citare le 


elezioni amministrative in alcune delle principali 
regioni italiane (Sicilia, Lazio e Lombardia), le allora 
imminenti elezioni politiche, la recessione, la cresci¬ 
ta dell'interesse e del dibattito intorno al Movimento 
5Stelle. Sono state considerate due sorgenti di tipo 
sociale: Twitter e YouTube. Per ogni puntata sono 
stati collezionati tutti i tweet contenenti le chiavi di 
ricerca #ballarò (hashtag ufficiale del programma) o 
@RaiBallaro (profilo Twitter ufficiale del programma). 

I commenti estratti da YouTube sono stati ottenuti, 
attraverso un'euristica di ricerca sui video correlati, 
a partire dal titolo del programma e dalla data di 
messa in onda ricavata dal modulo di analisi del 
palinsesto. Qui di seguito sono riportati alcuni casi 
di studio che aiutano a capire le potenzialità del 
framework. 

3.1 La social centrality 

II primo esempio considerato è lo studio dell'im¬ 
portanza (in termini di centralità dei nodi) dei per¬ 
sonaggi (politici, conduttori, opinionisti e così via) 
durante la messa in onda del programma "Ballarò". 
Per fare ciò, abbiamo considerato tutti i personaggi 
che sono stati ritenuti rilevanti da ogni estrattore 
(Twitter e YouTube in questo caso) durante il periodo 
di osservazione, costruendo, attraverso il modulo di 
query, un grafo come quello riportato in figura 4. 

Ogni grafo è stato costruito aggiungendo un arco 



Fig. 4- Grafo estratto dal modulo di query 

utilizzato per il calcolo della rilevanza 
sociale dei personaggi all'interno del 
caso di studio proposto 
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tra due personaggi se nell'intervallo temporale 
considerato esiste un percorso che li lega passando 
per un nodo di tipo concetto che rappresenti una 
puntata della trasmissione considerata. Dal momen¬ 
to che ad ogni episodio corrispondono molteplici 
finestre temporali di analisi, il modulo di query ha 
preventivamente aggregato tutti gli oggetti sociali 
validi nell'arco temporale considerato. E'importante 
notare, inoltre, che i percorsi trovati possono anche 
coinvolgere sorgenti differenti, implementando 
quindi quello che, nella precedente sezione, abbia¬ 
mo chiamato analisiinter-sorgente. 

Dato il grafo sociale costruito secondo la procedu¬ 
ra appena descritta, il calcolo della betweenness 
centrality [7][12] di ogni singolo nodo (cioè la 
frazione di percorsi minimi da ogni coppia di vertici 


che passano anche dal nodo considerato), permette 
di ottenere la lista ordinata della centralità del con¬ 
cetto all'interno del grafo di conoscenza. 

I risultati riportati in tabella 1 evidenziano che sia il 
comico Maurizio Crozza che l'ex-comico, ora leader 
del Movimento 5 Stelle, Beppe Grillo risultano esse¬ 
re i personaggi più discussi nel periodo di analisi, 
sebbene il secondo non abbia mai partecipato di¬ 
rettamente al programma come ospite. Seguono il 
Presidente del Consiglio dell'epoca, Mario Monti, 
ed il conduttore della trasmissione, Giovanni Floris, 
ma anche la centralità di personaggi che sarebbero 
diventati nuovi leader politici, come Matteo Renzi, 
è tra le più alte. 


Tab. 1 - Valori di rilevanza sociale ottenuti con il calcolo della betweenness 
centrality (prime dieci posizioni) 


Rank 

Personaggio 

Betweenness centrality 

1 

Maurizio Crozza 

0.1710 

2 

Beppe Grillo 

0.1710 

3 

Mario Monti 

0.1305 

4 

Giovanni Floris 

0.0954 

5 

Pier Luigi Bersani 

0.0868 

6 

Matteo Renzi 

0.0723 

7 

Gianfranco Polillo 

0.0259 

8 

Silvio Berlusconi 

0.0236 

9 

Bruno Tabacci 

0.0234 

10 

Gianfranco Fini 

0.0217 
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3.2 Studio della popolarità 

Il secondo esperimento proposto consiste nel cal¬ 
colo óeWevoluzione della popolarità dei personaggi 
nelle singole puntate considerate. Il concetto di 
popolarità rappresenta un tema molto dibattuto in 
letteratura ed in questo esperimento viene legato 
alla percentuale di menzioni del personaggio fatte 
nell'arco temporale di interesse dagli utenti delle 
due sorgenti analizzate. 

E' importante notare che questa informazione, in 
forma non aggregata, è calcolata da ogni estrat¬ 
tore. Viene memorizzata nel grafo di conoscenza 
all'interno dell'oggetto sociale complesso come 
peso della relazione di rappresentazione che lega 
l 'oggetto sociale stesso al concetto rappresentato, 
frutto dell'analisi di ogni singola finestra temporale. 
Data una singola sorgente, risulta quindi semplice 
per il modulo di analisi, aggregare proporzional¬ 
mente tutti i pesi di tali archi per ottenere, per ogni 
sorgente la popolarità relativa di ogni personaggio. 
A questo punto la popolarità complessiva inter- 
sorgente di ogni personaggio è ottenuta attraverso 
una combinazione lineare dei singoli valori: 

w(i) all = or w(i) tw + (1- a) ■ w(i) yt 


dove w('i) tv/ w(i) yt e w(i) all sono rispettivamente il 
peso di ogni nodo all'interno degli oggetti sociali 
della sorgente Twitter, YouTube e la risultante della 
combinazione lineare considerando i pesi ae(l-a). 

La figura 5 mostra l'andamento della popolarità 
dei sei personaggi più commentati su Twitter e 
YouTube (con a = 0.5). Si può notare come, mentre 
per la maggior parte dei personaggi l'andamento 
della popolarità nei vari episodi è abbastanza sta¬ 
bile, quello di Matteo Renzi evidenzia una coppia 
di picchi in corrispondenza delle puntate in cui è 
stato ospite della trasmissione. Possiamo inoltre no¬ 
tare come Renzi sia generalmente più popolare su 
Twitter rispetto a Beppe Grillo, che invece risulta più 
menzionato su YouTube (pur non avendo mai preso 
parte come ospite ad alcuna puntata). La popolarità 
di Silvio Berlusconi è molto bassa ed infatti egli non 
figurava, nel periodo di osservazione, tra i possibili 
candidati per lo schieramento di centro-destra. Si 
può infine notare come la popolarità di Nichi Ven¬ 
dola assuma un valore apprezzabile solamente nelle 
settimane che precedono le elezioni primarie della 
coalizione di centro-sinistra di fine novembre 2012. 


Fig. 5- Andamento della 
popolarità dei sei 
personaggi più menzionati 
all'interno del grafo di 
conoscenza 




Matteo Renzi Nichi Vendola 
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3.3 Analisi inter-sorgente 

Un ultimo interessante esempio di analisi inter- 
sorgente dimostra come, attraverso l'utilizzo del 
modello proposto, è possibile far emergere le re¬ 
lazioni latenti che legano elementi provenienti da 
sorgenti differenti che, solitamente, rappresentano 
mondi senza evidente contatto. Più in dettaglio, si 
è inteso mettere in relazione i video pubblicati su 
YouTube e gli hashtag utilizzati su Twitter relativi 
alle puntate di Ballarò, nell'intervallo temporale 
oggetto della sperimentazione, al fine di creare un 
primo esempio di servizio di raccomandazione che, 
dato un video pubblicato su YouTube, sia in grado 
di suggerire all'utente un insieme di hashtag da 
seguire su Twitter. 

Stabiliti, quindi, i vincoli temporali e il programma 
televisivo di interesse, il modulo diquery è in grado 
di individuare in maniera efficiente all'interno del 
grafo di conoscenza tutti i percorsi che collegano 
ogni video di YouTube ad un hashtag Twetter, pas¬ 
sando dai personaggi comuni rilevanti, individuati 
tramite i due estrattori presenti nel Source Proces¬ 


sing Layer. In questo modo è possibile costruire 
una matrice 

M:video x hashtag 

dove il valore di ogni cella esprime la forza della 
relazione tra un video ed un hashtag in termini di 
numero di personaggi televisivi in comune (come 
detto nella sezione precedente, i concetti rappre¬ 
sentano i nodi che permettono di creare un ponte 
semantico tra le diverse sorgenti). Data la matrice 
M, è possibile utilizzare uno dei più consolidati al¬ 
goritmi di co-ciustering non supervisionato [19] per 
calcolare le associazioni latenti inter-sorgente tra 
gruppi di video e gruppi di hashtag (per maggiori 
dettagli, si veda [20]). A questo punto, dato un video, 
è immediato individuare l'insieme di hashtag più 
rilevanti; i valori contenuti nella matrice M ci consen¬ 
tono, inoltre, di conoscere la forza della relazione. 

In figura 6 sono mostrate le due tag cloud che espri¬ 
mono l'insieme degli hashtag più rilevanti associati 
a due diversi video pubblicati su YouTube : i pesi dei 
termini di ogni singola tag cloud derivano dai valori 
degli elementi nella matrice M. 
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Fig. 6- Tag cloud degli hashtag 
più rilevanti relativi a due 
particolari video (a e b) 
pubblicati su YouTube 
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4. Conclusioni 

In questo articolo è stata descritta l'attività del 
Centro Ricerche e Innovazione Tecnologica RAI nella 
definizione di un framework per l'integrazione di 
dati eterogenei provenienti da molteplici sorgenti 
sia tradizionali, come gli archivi televisivi, le EPG e 
le ontologie, sia sociali, come Twetter e Facebook. Il 
cuore del sistema è rappresentato dalla definizione 
di una base di conoscenza, basata su un modello a 
grafo, in grado di rappresentare e integrare in ma¬ 
niera efficiente ed efficace le attività degli utenti. 
Alcuni esempi hanno permesso di dimostrare come 
il sistema possa essere utilizzato per implementare 
innovative metodologie di analisi inter-sorgente, 
facendo, quindi, emergere dai dati l'esistenza di 
pattern latenti. 

Ci si attende quindi che la possibilità di tracciare 
quella che è stata definita la seconda vita del con¬ 
tenuto televisivo potrà influenzare positivamente 
l'attività di diversi attori. I broadcaster avranno a 
disposizione una nuova tipologia di archivio che 
permetterà agli esperti del dominio di avere una 
visione integrata dell'evoluzione nel tempo del 
contenuto televisivo per quanto riguarda l'interes¬ 
se degli utenti dei social network, potendo quindi 
analizzare, tra le altre cose, i trend, le relazioni tra 
personaggi, l'evoluzione delle opinioni e la popo¬ 
larità. A livello editoriale, la piattaforma di analisi 
permette di individuare contenuti, personaggi e 
temi più emergenti e discussi dagli utenti, fornendo 
quindi un supporto decisionale nella pianificazione 
del palinsesto e nella creazione di nuovi contenuti. 
L 'utente finale potrà godere in maniera indiretta 
dei vantaggi dell'uso della piattaforma da parte 
delle media company. Il framework proposto potrà, 
infatti, essere utilizzato come base per la creazione 
di sistemi di raccomandazione in servizi di video on 
demand e come sorgente di informazioni comple¬ 
mentari in applicazioni second screen. 

L'attività attuale si sta concentrando principalmente 
su tre fronti: da un lato si intende aumentare il po¬ 
tere espressivo del modello, permettendo quindi di 
catturare in maniera ancora più accurata gli aspetti 
rilevanti dell'attività degli utenti sui social network. 


Dall'altro lato, l'accuratezza degli strumenti di rico¬ 
noscimento delle entità e estrazione delle emozioni 
è un fattore determinante di tutto il sistema e per 
questo motivo è in corso un ulteriore sforzo verso 
un continuo miglioramento delle prestazioni. Inol¬ 
tre, è in fase di realizzazione un prototipo software 
che rappresenti, per l'utente finale, un sistema di 
alto livello per la valutazione della popolarità, della 
reputazione, dei sentimenti e più in generale dei 
trend dei concetti televisivi. 
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A cura della Redazione 

Hybrid Content Radio 
La radio dell'ascoltatore 


Hybrid Content Radio è un progetto interno al 
Centro Ricerche e Innovazione Tecnologica nato 
allo scopo di ideare e realizzare nuovi servizi pro- 
totipali nell'ambito radiofonico con una particolare 
attenzione alle esigenze di standardizzazione ad 
essi collegate. 

Caratteristiche del progetto 

L'immediatezza e la pervasività del mezzo fan sì 
che la radio sia un mezzo di comunicazione molto 
popolare: in Italia più dell'80% della popolazione 
ascolta la radio nelle sue diverse forme. Negli ultimi 
anni, i servizi di streaming audio basati su racco¬ 
mandazioni (ad esempio Spotify, Deezer, Pandora) 
stanno conquistando ascolti sempre maggiori, 
grazie al livello di personalizzazione che sono in 
grado di offrire. 

In questo contesto, si propone un nuovo concetto 
di servizio radiofonico: la hybrid content radio (HCR ), 
che offre la possibilità di personalizzare una parte 
del palinsesto radiofonico tradizionale mediante 
contenuti audio di arricchimento recuperati dagli 
archivi radiofonici. Il contenuto personalizzato 
sostituituisce, in modo automatico e in base alle 
preferenze dell'ascoltatore, quello programmato 
sul palinsesto. Il risultato è un servizio che, in parte, 
offre i contenuti della tradizionale radio lineare dif¬ 
fusiva e, in parte, è personalizzato. In questo modo 
l'esperienza di ascolto diventa unica e più vicina 
all'ascoltatore, valorizzando al contempo i conte¬ 
nuti originali presenti negli archivi di produzione 
radiofonica per i quali la Rai si distingue. 


Il Centro Ricerche e Innovazione Tenologica sta 
costruendo una visione comune su questo tipo 
di servizio, insieme ad alcuni broadcaster pubblici 
europei che aderiscono al gruppo Digital Radio 
Platforms and Services della European Broadcasting 
Union (EBU). 

Contenuti personalizzati inseriti in un 

PALINSESTO LINEARE 

Il palinsesto lineare della radio tradizionale co¬ 
stituisce la base di contenuti su cui un sistema di 
raccomandazione inserisce contenuti persona- 
lizzati, semplicemente sostituendoli ai contenuti 
programmati. La hybrid content radio non richiede 
un canale radio specifico e può funzionare con la 
radio digitale DAB+, la tradizionale radio FM o an¬ 
che l 'audio streaming su Internet. Sulla base audio 
lineare vengono inseriti i clip audio di arricchimento, 
specifici e in generale diversi per ogni utente, che 
vanno a sostituire parti del flusso lineare. Uno dei 
punti cardine del servizio sta nella modalità in cui 
sono scelti i clip audio di arricchimento. La scelta in 
generale deve avvenire tenendo conto del conte¬ 
sto dell'ascoltatore, termine da intendersi in senso 
ampio, che include tutte le condizioni al contorno 
dell'utente (generi preferiti, dati demografici, atti¬ 
vità, localizzazione e così via). 

I problemi tecnici da affrontare sono molteplici. 
Innanzitutto, ad oggi, non esiste ancora un'inter¬ 
faccia comune ai ricevitori radio su smartphone e 
questo blocca la nascita di un mercato orizzontale 
per le applicazioni su radio broadcast (la modalità 
di funzionamento più efficiente in termini di energia 
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dissipata e costo trasmissivo). Inoltre, data la varietà 
di terminali e le condizioni locali della rete Internet, è 
necessaria una opportuna sincronizzazione dei con¬ 
tenuti di arricchimento con la base audio lineare. In¬ 
fine, i contenuti di arricchimento hanno una durata 
variabile e non assimilabile direttamente agli spazi 
di programma definiti nel palinsesto audio lineare. 

Ricevitori disponibili 

La hybrid content radio è attualmente realizza¬ 
bile, senza modifiche tecniche ai dispositivi, su 
smartphone, utilizzando il collegamento Internet 
in una configurazione full IP sia per il canale audio 
lineare sia per i contributi personalizzati, . Questi 
dispositivi supportano nativamente la hybrid con¬ 


tent radio in full IP, indipendentemente dal sistema 
operativo mobile (Android, iOS, Windows Phone, 
FirefoxOSo altri). Anche la fruizione da PC è possibile 
in modalità full IP. 

Verso la standardizzazione 

Il Centro Ricerche e Innovazione Tecnologica, in 
collaborazione con il gruppo EBU-Digital Radio 
Platforms and Services, sta operando per armoniz¬ 
zare le diverse iniziative di hybrid content radio già 
in essere nel resto d'Europa. L'obiettivo è di creare le 
linee guida per l'utilizzo di protocolli e di tecnologie 
già esistenti, come gli standard creati dal progetto 
RadioDNS, per fornire un servizio di hybrid content 
radio interoperabile. 


Ascoltatore A Ascoltatore B 



Per saperne di più 

Gruppo Digital Radio Platforms and Services (DRP) della EBU: https://tech.ebu.ch/aroups/drp 
Progetto RadioDNS: https://radiodns.ora/ 

P. Casagranda : La Radio Ibrida: l'evoluzione della radio diffusiva secondo il progetto RadioDNS. in Elettronica 
eTelecomunicazioni, Dicembre 2011 
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BRIDGET Review 



A fine gennaio 2015 si è tenuta con successo presso 
il CRIT la "first year review" del progetto BRIDGET 
durante la quale sono stati presentati ai responsabili 
della comunità europea i risultati ottenuti al termine 
del primo ciclo di lavoro. La valutazione data dai 
revisori è stata positiva. 


Nell'occasione sono state presentate ai revisori an¬ 
che alcune proposte relative al materiale che sarà 
utilizzato nei prossimi usertrials che si terranno nel 
mese di luglio presso il Centro di Produzione RAI 
di Torino. 


0 BRIDging thè Gap for 
Enhanced broadcasT 


Il CRIT al NAB SHOW 2015 



Dall'l 1 al 16 aprile si è tenuta a Las Vegas l'edizione 
2015 del NAB Show. Il NAB Show è un importante 
appuntamento annuale organizzato dalla National 
Association ofBroadcaster, l'associazione dei broad- 
caster statunitensi. 

Quest'anno il CRIT ha partecipato alla manife¬ 
stazione in qualità di espositore insieme all'IBM, 
presentando YActive Media Store, un innovativo 
sistema di CloudStorage dotato di funzionalità spe¬ 
cificatamente studiate per l'esecuzione e la gestione 
dei workflow tipici della produzione, archiviazione 
e distribuzione multimediale. 


Il sistema presentato è stato sviluppato nell'ambito 
di un accordo bilaterale tra RAI e IBM siglato con l'o¬ 
biettivo di continuare la collaborazione sulle tema¬ 
tiche al centro del progetto europeo VisionCloud. 


Il CRIT al Roland Garros 2015 

Nei mesi scorsi è stata formalizzata una collabora¬ 
zione tra il CRIT e France Télévision allo scopo di 
testare e utilizzare il sistema microfonico 3D VMS, 
sviluppato da CRIT, per riprendere un evento di 
grande rilievo quale il Roland Garros 2015, sfrut¬ 
tando tale sistema per la ripresa e la trasmissione 
audio in diretta dell'evento. 

In quest'ambito sono stati installati un Array Cilin¬ 
drico 3D VMS e una IP Camera sul campo principale 
dell'evento, il Court Philippe-Chartier e, più precisa- 
mente, vicino alla telecamera principale presso la 
tribuna RenèLacoste. In un primo momento la posi¬ 
zione scelta era presso la metà campo di fronte alla 
tribuna Henri Cochet, tuttavia l'eccessiva distanza 


dalla zona TV, circa 168 metri, dalla quale il sistema 
sarebbe poi stato controllato, non assicurava il suo 
regolare funzionamento. Si è quindi optato per la 
posizione finale in tribuna Lacoste. 

Si è scelto di utilizzare un Array Cilindrico rispetto ad 
un Array Sferico in base al fatto che il primo garan¬ 
tiva una migliore qualità timbrica e una maggiore 
pulizia del suono, secondo quanto dedotto dai test 
effettuati e valutati sia dai tecnici Rai sia dai tecnici 
di France Télévision. 

Per tutta la durata dell'evento (24 maggio - 7 giugno) 
l'audio ripreso dal sistema 3D VMS è stato mixato e 
gestito per la diretta dalla squadra tecnica francese 
ed è stato utilizzato, durante gli ultimi due giorni 
del torneo, anche per la trasmissione prodotta in 
UHDTV. 






















